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(57) Abstract: According to the invention, memories are associated with a reconfigurable component (VPU) at the inputs and out- 
puts thereof, so that the internal data processing and particularly the reconfiguration cycles can be decoupled from the external data 
streams (to/from periphery, memories etc.). 

(57) Zusammenfassung: Einem rekonfigurierbaren Baustein (VPU) werden an den Eingangen und/oder Ausgangen Speicher zu- 
geordnet, um eine Entkopplung der intemen Datenverarbeitung und i.b. der Rekonfigurationszyklen von den externen Datenstrdmen 
(zu/von Peripherie, Speichern etc) zu eireichen. 



WO 02/071248 A2 ■MBMMHI 



102 06 653.1 15. Februar 2002 (15.02.2002) DE 

102 06 856.9 18. Febniar 2002 (18.02.2002) DE 

102 06 857.7 18. Febniar 2002 (18.02.2002) DE 

102 07 225.6 21. Febniar 2002 (21.02.2002) DE 

102 07 224.8 21. Febniar 2002 (21.02.2002) DE 

102 07 226.4 21. Febniar 2002 (21.02.2002) DE 

(71) An m elder (fir alle Bestimmungsstaaten mit Ausnahme 
von US): PACT INFORMATIONSTECHNOLOGIE 
GMBH [DE/DE]; Leopoldstrasse 236, 80807 Miinchen 
(DE). 



MK, MN, MW, MX, MZ, NO, NZ, OM, PH, PL, PT, RO, 
RU, SD, SE, SG, SI SK, SL, TJ, TM, TN, TR, TT, TZ, 
UA, UG, US, UZ, VN, YU, ZA, ZM, ZW. 

(84) Bestimmungsstaaten (regional): ARIPO-Patent (GH, 
GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, ZW), 
eurasisches Patent (AM, AZ. BY, KG, KZ, MD, RU, TJ, 
TM), europaisches Patent (AT, BE, CH, CY, DE, DK, 
ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, TR), 
OAPI-Patent (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, 
ML, MR, NE, SN, TD, TG). 



(72) Erfinder; und 

(75) Erfinder/Anmetder (nur fir US): VORBACH, Martin 
[DE/DE] ; Gotthardstrasse 117a, 80689 Miinchen (DE). 

(74) Anwalt: PIETRUK, Claus, Peter; European Patent At- 
torney, Heinrich-Lilienfein-Weg 5, 76229 Karlsrahe (DE). 

(81) Bestimmungsstaaten (national): AE, AG, AL, AM, 
AT, AT (Gebrauchsmuster), AU, AZ, BA, BB, BG, BR, 
BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DE (Ge- 
brauchsmuster), DK, DM, DZ, EC, EE, ES, FI, GB, GD, 
GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, 
KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, 



Erkiarung gemSB Regel 4.17: 

— hinsicktlich der Berecktigung des Anmelders, ein Patent zu 
beantragen und zu erhalten (Regel 4.17 Ziffer ii) fir alle 
Bestimmungsstaaten 

Verfffentlicht: 

— ohne international Recherchenbericht und erneut zu 
verdffentlichen nach Erhalt des Berichts 

Zur Erkiarung der Zweibuchstaben-Codes und der anderen 
Abkurzungen wird auf die Erkldrungen ("Guidance Notes on 
Codes and Abbreviations") am Anfang jeder regularen Ausgabe 
der PCT-Gazette verwiesen. 



WO 02/071248 



PCT/EP02/02398 



Titel: Verfahren und Vorrichtungen_.zur Datenbe- 

und/oder verarbeitung 

5 Beschreibung 

Die vorliegende Erfindung betrifft das oberbegrif flich bean- 
spruchte. Damit befaBt sich die vorliegende Erfindung mit re- 

10 konfigurierbaren Bausteinen im Allgemeinen und hierbei insbe- 
' sondere, jedoch nicht ausschlieftlich mit der Entkopplung der 
Datenverarbeitung innerhalb des rekonf igurierbaren Bausteines 
bzw. innerhalb von Teilen des rekonf igurierbaren Bausteines 
und Datenstrdmen, und zwar sowohl innerhalb des rekonfigu- 

15 rierbaren Bausteines als auch zu und von Peripherie, Massen- 
speichern, Hostprozessoren und dergleichen. 
DE 101 10 530. 4DE 102 02 044.2 

<Einem rekonf igurierbaren Baustein (VPU) werdeh an den Eingan- 
gen und/oder Ausgangen Speicher zugeordnet, um eine Entkopp- 
20 lung der internen Datenverarbeitung und i.b. der Rekonf igura- 
tionszyklen von den externen Datenstrdmen (zu/von Peripherie, 
Speichern etc) zu erreichen. 

Unter einer rekonf igurierbaren Architektur werden vorliegend 
25 Bausteine (VPU) mit konf igurierbarer Funktion und/oder Ver- 
netzung verstanden, insbesqndere integriefte Bausteine mit 
-einer Mehrzahl von ein- oder mehrdimensional angeordneten 
arithmetischen und/oder logischen und/oder analogen und/oder 
speichernden und/oder intern/extern vernetzenden B'augruppen, 
30 . die direkt oder durch ein Bussystem iaiteinander verbunden 
sind. 
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Zur Gattung dieser Bausteine zahlen insbesondere systolische 
Arrays, neuronale Netze, Mehrprozessor Systeme, Prozessoren 
mit mehreren Rechenwerken und/oder logischen Zellen und/oder 
kommunikativen/peripheren Zellen (10) , Vernetzungs- und Netz- 
5 werkbausteine wie z.B. Crossbar-Schalter, ebensa wie bekannte 
Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc. . 
Hingewiesen wird insbesondere in diesem Zusammenhang auf die 
folgenden Schutzrechte und Anmeldungen desselben Anmelders: P 
44. 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, 

10 DE 196 54 846.2-53, DE 196 54 593.5-53, DE 197 04 044.6-53, 
DE 198 80 129.7, DE 198 61 088.2-53, DE 199 80 312.9, 
PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 
DE 101 10 530.4, DE 101 11 Q14.6, PCT/EP 00/10516, 
EP 01 102 674.7, DE 196 51 075.9, DE 196 54 846. .2, DE 196 54 

15 593.5, DE 197 04 728.9, DE 198 07 872.2, DE 101 39 170.6, DE 
199 26 538.0, DE 101 42 904.5, DE 101 10 530.4, DE 102 02 
044.2, DE 102 06 857.7, DE 101 35- 210.7, EP 02 001 331.4, EP 
01 129 923.7 sowie die jeweiligen Parallelanmeldungen hierzu. 
Diese sind allesamt hiermit zu Of f enbarungszwecken vollum- 

20 fanglich eingegiiedert . 

Die o.g. Architektur wird beispielhaft zur Verdeutlichung 
herangezogen und im folgenden VPU genannt. Die Architektur 
besteht aus beliebigen arithmetischen^ logischen (auch Spei- 

25 cher) und/oder Speicher zellen und/oder Vernetzungs zellen 

und/oder kommunikativen/peripheren (10) Zellen (PAEs) , die zu 
einer ein- oder mehrdimensionalen Matrix (PA) angeordnet sein 
kc3nnen, wobei die Matrix unterschiedliche beliebig ausgestal- 
tete Zellen aufweisen kann,. auch. die Bussysteme werden dabei 

30 als Zellen verstanden. Der Matrix' als* ganzes oder Teilen da- 
von zugeordnet ist eine Konfigurationseinheit (CT) ,. die die 
Vernetzung und Funktion des PA beeinf lufit .. 
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Speicherzugriffsverfahren fttr rekonfigurierbare Bausteine, 
die nach einem DMA-Prinzip arbeiten sind aus P 44 16 881.0 
bekannt, wobei eine oder mehrere DMAs dabei durch Konfigura- 
5 tion entstehen. In DE 196 54 595.1 sind DMAs fest in die In- 
terface-Baugruppen implementiert und konnen durch das PA oder 
die CT angesteuert werden. 

In DE 196 54 846.2 ist das Beschreiben von internen Speichern 
durch externe Datenstrome und das Wiederauslesen der Spei- 

10 cherdaten an externe Einheiten beschrieben. 

DE 199 26 538.0 beschreibt erweiterte- Speicherkonzepte ent- 
sprechend DE -196 54 846.2, urn eine einfacher zu programmie- 
rende und leistungsf ahigere Dateniibertragung zu erreichen. 
In US 6,347,346 wird ein Speichersystem beschrieben, das in 

15 alien wesentlichen Punkten DE.196 54 846.2 entspricht, wobei 
es einen expliziten Bus (global system port) zu einem globa- 
len Speicher aufweist. Es beschreibt US6,341,318 ein Verfah- 
ren zum Entkoppeln von externen Datenstromen von der internen 
Datenverarbeitung derart, "class ein Double-Buffer Verfahren 

'20 verwendet wird, wobei jeweils ein Buffer die externen Daten 
aufnimmt/ausliest, wahrend ein anderer die internen Daten 
aufnimmt/ausliest; sobald die Buffer entsprechend ihrer Funk- 
tion voll/leer sind, werden die Buffer umgeschaltet, d.h. der 
vormals fur die internen Daten zustandige Buffer leitet nun- 

25 mehr seineDaten an die Peripherie bzw. (liest neae Daten von 
der Peripherie) , und die vormals fur die externen; Daten zu- 
standige leiten nunmehr ihre Daten an das PA. (lesen neiie Da- 
ten von dem PA) . Die Double-Buffer sind derart in <ier Appli- 
cation verwendet, dass sie einen zusammenhangenden Datenbe- 

30 reich buff era. . 
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Derartige Doppelpuf feranordnungen haben massive Nachteile 
insbesondere im Datenstrombereich, d.h. beim sogenannten Da- 
tastreaming, in welchera grofie Mengen an sukzessive in ein 
Prozessorfeld Oder dergleichen einstrdmenden Daten auf immer 
5 wieder gleiche Weise bearbeitet werden miissen. 

Aufgabe der Erfindung ist es, Neues fur die gewerbliche Nut- 
zung bereitzustellen.- 

10 .Die Losung der Aufgabe wird unabhangig beansprucht. Bevorzug- 
te Ausfuhrungsformen befinden sich in den Unteranspriichen. 

Das erfindungsgemaBe Verfahren erlaubt soitiit im Gegensatz zu 
dem vorbekannten, gerade. im Kernbereich typischer Anwendungen . 
15 von rekonfigurierbaren Prozessoren nachteiligen Stand der 
Technik eine wesentlich einf achere . Kontrolle der Buffer bzw. 
• zwischengeschalteten Speicher. Externe und interne Bussysteme 
kSnnen aufgrund der zwischengeschalteten Speichermittel pro- 
blemfrei mit unterschiedlichen Transfer- bzw. Ubertragungsra- 
20 ten und/oder Taktf requenzen be trieben /werden, weil durch die 
.*" Buffer Daten zwischengespeichert werden- Es werden im Ver- 
gleich zu Schlechteren *Lc>sungen aus dem Stand der Technik we- 
■ niger Speichermittel, typisch nur halb so viele Buffer bzw. 
. Datentransfersohnittstellenspeichermitntel benotigt, wobei 
25 sich die Hardwarekosten massiv reduzieren; Schatzungen der 
Hardwarekostenreduktion belaufen sich auf 25% bis 50%. Auch 
ist es einfachier, Adressen zu- generieren und die Anordhung zii 
programmieren, da die* Buffer fur den Programmierer transpa- 
rent sind. Die Hardware ist einfacher zu beschreiben und ist 
30- zu debuggen. 
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Ein Paging-Verfahren kann integriert werden, das verschiedene 
Datenbereiche insbesondere fur verschiedene Konfigurationen 
buffert. 

5 

Es sei zunachst darauf hingewiesen, dafl verschiedene Spei- 
chersysteme als Schnittstelle (Interface) zur 10 bekannt 
sind. Verwiesen wird auf P 44 16 881 .0, DE 196 54 595.1, DE 
199 26 538.0* Weiterhin ist aus DE 196 54 846.2 ein Verfahren 

10 bekannt, bei dem zunachst Daten von der 10 geladen werden, 
(1) Daten nach deren Berechnung innerhalb eiher VP0 gespei- 
chert werden, (2) das Array (PA) umkonf iguriert wird, {3) die 
Daten aus dem internen Speicher ausgelesen werden und wieder 
in einen anderen internen Speicher geschrieben werden, (4) so 

15 lange, bis das vollstandig berechnete Ergebnis an die IO ge- 
sendet wird. Urn- bzw. Rekonf iguration bedeutet, dass bei- 
spielsweise eine von einem Teil des Feldes rekonf igurierbarer 
Einheiten oder dem Gesamtfeld ausgefUhrte Funktion und/oder 
* die' Datenverrietzung und/oder Daten und/oder Konstanten, die 

20 bei der Datenverarbeitung erforderlich sind, neu bestimmt 
werden. Je nach Anwendung und/oder. Ausgestaltung werden VPUs 
beispielsweis.e nur komplett oder auch partlell rekonfigu- 
riert. Unterschiedliche Rekonf igurationsverf ahr en sind imple- 
mentierbar, z.B. komplette Rekonf iguration durch Umschalten. 

25. von Speicherbereichen DE 196 51 075.9, DE 196 54 846.2 
und/oder WaveReconf iguration (DE 198 07 872.2, DE 199 26 
538.0, DE. 10Q 28 397^7, DE 102 06 857.7.) und/oder einfaches 
konfigurieren adressierbarer Konfigurationsspeicher (DE 196 
. 51 07-5.9,- DE 196 54 846. 2>. DE 196 54 593.5) . Die jeweiligen 

"30 Schrifteh werden zu Offenbarungszwecken vollumf anglich einge- 
gliedert . 
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In einer bevorzugten Ausgestaltung ist eine VPD gesamt oder 
partiell mittels eine WaveRekonf iguration oder dem direkten 
setzen von adressierbarer. Konfigurationsspeicher konfigurier- 
bar . 

5 

Es besteht somit eines der wesentlichen Arbeitsprinzipien der 
VPU-Bausteine darin, Daten zwischen mehreren Speichern hin 
und her zu kopieren, wobei wahrend jedes Kopiervorganges zu- 
satzliche und ggf . dieselben (z.B. langer FIR-Filter) 
10 und/oder andere (z.B. FFT gefolgt von Viterbi) Operationen 
liber den Daten durchgefuhrt werden. Abhartgig von der jeweili- 
gen Applikation werden die Daten aus einem oder mehreren 
Speichern gelesen und in einen oder mehrere Speicher ge- 
schreiben. 

15 

Zum Speichern von Datenstromen und/oder Zustanden (Trigger, 
vgl. DE 197 .04 728.9, -DE 199 26 538.0) werden interne/externe 
Speicher (z.B. als FIFOs) verwendet und entsprechende Adress- 
generatoren eingesetzt. Jede sinnvolle Speicherarchitektur 
20-" kanh algorithmenspezif isch fest implementiert und/oder flexi- 
bel kpnfiguriert werdeh/sein. 

Vorzugsweise werden aus .Per.fbrinancegfunden die ihterhen Spei- 
cher der VPU verwendet, grundsatzlich sind auch externe Spei- 
• cher verwendbar. 

25 

Dies vprahgestellt, sei nunmehr zum prinzipiellen Aufbau fol- 
gendes angemefkt : . 

Einem Array .(PA) werden Interf ace-Baugruppen. zugeordnet, die 
30 Daten zwischen den Bussystenien des PA und externen Einheiten 
kommunizieren- (vgl. P 44 16 881.0, DE 196 5'4 595.1). Die In- 
terface-Baugruppen verkniipfen Adress.busse und Datenbusse der- 
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art, dass eine feste Zuordnung zwischen Adressen und Daten 
entsteht. Bevorzugt konnen Interface-Baugruppen selbstandig 
Adressen Oder Teile von Adressen generieren. 
Den Interface-Baugruppen werden FIFOs zugeordnet, die die in- 
5 terne Datenverarbeitung von der. externen Datentibertragung 
entkoppeln. Ein FIFO stellt hier ein datendurchstrombares 
Puffer- bzw. Eingangs-/Ausgangsdatenspeichermittel dar, das 
zur Datenverarbeitung insbesondere wahrend des Ausfiihrens ein 
und derselben Konf igura.tion nicht umgeschaltet werden mufi. 

10 Soweit neben FIFO-Speichern andere datendurchstrombare Puf- 
fermittel bekannt* sirid, werden diese na'chf olgehd. glelchfalls 
als von dem Begriff umfafit sein, wo anwendbar. Erwahnt- seien 
insbesondere Ringspeicher mit einem oder mehreren Zeigern, 
insbesondere wenigstens einem Schreib- und einem Lesespei- 

15 cher. Somit kann beispielsweise wahrend mehrerer Rekonfigura- 
tionszyklen zur Abarbeitung einer Applikation der externe Da- 
tenstrom weitgehend konstant aufrecht erhalten werden, unab- 
hangig von den internen Verarbeitungszyklen. Die FIFOs konnen 
eingehende/ausgehende Daten und/oder Adressen speichern. Die 

20 FIFOs konnen in eine Interface-Baugruppe integriert oder die- 
ser oder mehreren dieser zugeordnet werden. Es konnen je nach 
Ausgestaltung auch FIFOs in den Ihterfacebaugruppen inte- 
griert sein und gleichzeitig zusatzliche separate implemen- 
tiert sein-. Auch sind datendurchstromt^re Puffermittel mog- 

25 lich/die integriert. nrit dem Baustein sind, beispielsweise 
durch Integration' von FIFO-Grupen auf einem eine rekonfigu- 
rierbare: Prozessoranordniing bildenden Chip.. 

Zwischen den (auch separaten} FIFOs und den Interf ace- 
30 Baugruppe.ri konnen in einer moglichen Ausgestaltung Multiple- 
xer zur freien Zuordnung von Interface-Baugruppen und .FIFOs 
vorhanden sein. Die- von einem Multiplexer jeweils eingehomme- 
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ne Zuschaltung von FIFOs zu externen Baugruppen Oder internen 
Teilen des Prozessorfeldes kann in einer bevorzugten Anord- 
nung aus dem Prozessorfeld heraus vorgegeben werden, bei- 
spielsweise von der datensendenden und/oder -empfangenden 
5 PAE, ist aber auch f sollte dies gewiinscht sein, von einer 
hierarchisch iibergeordneten Einheit bestimmbar, wie einem 
Hostprozessor im Fall der Aufteilung der Datenverarbeitung in 
einen hochparalleien und einen schlecht parallelisierbaren 
Aufgabenanteil und/oder es ist moglich, die Multiplexer- 
10 Schaltung durch externe Vorgaben zu bestimmen, was sinnvoll 
sein kann, wenn mit den Daten etwa angegeben wird, unfwelche 
Art von Daten es sich handelt und wie sie zu verarbeiten 
sind. 

. Seitens des externen Anschlusses sind Einheiten zur Proto- 

15 kollkonvertierung zwischen den internen und den externen Bus- 
protokollen {z.B. RAMBUS, AMBA, PCI, etc) vorgesehen. Mehrere 
unterschiedliche Protokollkonverter konnen innerhalb einer 
Ausgestaltung verwendet werden. Die Protokollkonverter kdnnen 
separat ausgestaltet sein Oder in die FIFOs oder in die In- 

20 terface-Baugruppen integriert sein. 

Zwischen den (separaten) Pro'tokollkonvertern und den Inter- 
face-Baugruppen/ FIFOs konnen in einer mogiichen Ausgestaltung 
Multiplexer zur freien Zuordnuhg von Interface- 
Baugruppen/FIFOs und Protokollkon'vert^rn vorhanden sein. 

25 Den Protokollkonve.rtern nachgeschaltet kann sich eine weitere 
Multiplexerstuf e bef inden, wodurch. beispielsweise mehrere AM- 
BA-Businterface auf denselben AMBA-Bus auf geschaltet sein - 
konnen.. Diese Multiplexerstuf e kann* beispielsweise auch- durch 
die Eigenschaft. eines externen .Busses entstehen, mehrere Ein- 

.30 heiten adressieren zu konnen. 
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In einer bevorzugten Ausftihrung arbeitet die Schaltung in ei- 
nem Master und einem Slave Betriebsmodus . Im Mastermodus wer- 
den die Adressen und Buszugriffe durch die Schaltung und/oder 
das zugeordnete PA generiert, im Slavemodus wird von externen 
5 Einheiten auf die Schaltung bzw. das PA zugegriffen. 

In weiteren Ausgestaltungen konnen innerhalb der Schaltung 
applikationsabhangig zusatzliche Pufferspeicher Oder Daten- 
sammelspeicher (Collector) zum Datenaustausch zwischen den 

10 Interface-Baugruppen vorgesehen sein. Diese Pufferspeicher 
. arbeiten bevorzugt in einem Random-Access-. und/oder MMU- 
Paging- und/oder Stack-Modus und konnen .eigene Adressgenera- 
toren aufweisen. Die Pufferspeicher sind bevorzugt als Multi- 
Port Speicher ausgestaltet, um den gleichzeitigen Zugriff 

15 mehrerer Interf ace-Bauguppen zu ermoglichen. Auf die Puffer- 
speicher kann von einer ubergeordneten Datenverarbeitungsein- 
heit insbesondere von dem rekonf igurierbaren Baustein (VPU) 
zugeordneten Prozessoren wie DSPs, CPUs, Mikrokontroller etc. 
zugegriffen werden. 

20 

Es sei nun angegeben r wie auf besondere Weise externe Daten- 
strome ^entkoppelt werden kbhnen. Gemafr einem- wesentlichen 
Aspekt der Erf indung Werden die externen- Datenstrome durch 
FIFOs (Input-/Output-FIFO, zusammengefafit IO-FIFO) , die zwi- 
25 scheh der Protokollkonverte'rn und den Interface-Baugruppen 
eingesetzt sind, entkoppeltv 

Das Datenverarbeltungsverfahren funktioniert wie folgt: 
Durch einen cider raehrere Input-FIFQ werden die .eingehenden 
Daten von der Datenve'rarbeitvmg im Array (PA) entkoppelt. 
. 30 Die Datenverarbeitung kann in folgenden Schritten. erfolgen: 
1. Das /die Input-FIFO wird/werden. ausgelesen, vom Array 
(PA) verarbeitet und/oder in einen oder mehrere (ande- 
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re) , lokal dem Array zugeordneten und/oder bevorzugt 
seitliche an das Array gekoppelten Speicher (RAM-Bankl) 
geschrieben. Die seitliche. Ankopplung hat den Vorteil, 
daB sich die Chiparchitektur und/oder deren Entwurf ver- 
5 einfacht. 

2. Das Array (PA) wird umkonfiguriert . Die Speicher (z.B. 
RAM-Bankl) werden ausgelesen, die Daten werden verarbei- 
tet und in einen oder mehrere Speicher (z.B. RAM-Bank2 
und/oder RAM-Bankl) oder alternativ bereits an die Out- 

10 put-FIFOs gemafl Schritt 4 geschrieben. 

3. Das Array (PA) wird wieder umkonfiguriert und die Daten 
werden wieder in ein Speicher geschrieben. 

4. Dies setzt sich so lange fort, bis das Ergebnis an einen 
oder mehrere Output-FIFO zum Ausgang gesendet wird. 

15 - 5. Danach werden wieder neue Daten von dem/den Input-FIFO 

ausgelesen und entsprechend verarbeitet, d.h. die Daten- 
verabeitung wird bei Schritt 1 fortgesetzt. 

Durch die bevorzugte Ausbildung der Input-/Output-FIFOs (.10- 
20 FIFOs) als multi-ported FIFOs kann die Datenverarbeitung da- 
bei zeitgleich mit dem Einschreiben bzw. Auslesen der jewei- . 
ligen FIFOs durch die Protokollkonverter erfolgen. 
Durch die vorstehend beschriebene Weise entsteht eine zeitl'i- 
che .Entkopplung, die die „quasistatxoi)are" Verafbeitung von 
25 konstanten Datenstr5men derart' ermOglichtv daB lediglich : noch 
eine .Latenz, aber keine Unterbrechurtg. des Dateristromes mehr 
auftritt, wenn die ersten Dateripakete durchgelaufen sind. 
In eiher erweiterten AusgestaltUng. konnen die IO-FIFOs derart 
aufgebaut sein, da.ss entsprechend der • Applikation die Anzahl 
30 der IO-FIFOs und deren Tiefe gewShlt . werden kann. Mit arideren 
Worten konnen IO-FIFOs (z.b. uber Transmission Gate,. Multi- 
plexer/Demultioplexer etc) zerteilt oder zusammengefaBt wer- 
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den, sodass mehr oder tiefere IO-FIFOs entstehen. Beispiels- 
weise konnen 8 FIFOs zu je 1024 Worten iinplementiert sein, 
die derart konfiguriert werden, dass entweder 8 FIFOs 6 1024 
Worte oder 2 FIFOs a 4096 Worte oder z.B. 1 FIFO mit 4096 
5 Worten und 4 mit 1024 Worten konfiguriert sind. 

Je nach Ausgestaltung des Systems und Anforderungen der Algo- 
rithmen sind Modif ikationen des beschriebenen Datenverarbei- 
tungsverfahrens moglich. . 

10 In einer erweiterten Ausgestaltung arbeiten die FIFOs derart, 
dass bei Output-FIFOs aiich die zu den Dateneintragen gehdren- 
den Adressen in den FIFOs gespeichert werden und/oder Input- 
FIFOs derart aufgebaut sind, dass jeweils ein FIFO ftir die 
auszusendende/ausgesendete Leseadressen und ein FIFO fur die 

15 eingehenden den Adressen zugeordneten Datenworte existiert. 

Es sei nun diskutiert, wie eine erf indungsgemafi mogliche, FI- 
FO-RAM-Bank Kopplunq in einer besonders bevorzugten Variante 
• der Erfindung erfolgen kann. 

20 

Je nach Applikation ist es moglich, den Datentransfer mit den 
IO-FIFOs tiber' eine oder mehrere weitere, -lokal dem Array zu- 
geordnete oder bevprzugt seitlich an das Array gekoppeite, 
Speicherstuf e (n) (RAM-Bank) zu f (ihren.^und erst dann an die . 
25 datenverarbeitenden PAEs (z.B. ALU-PAEs nach DE 196 51 075.9) 
weiterzuleiten . 

. In einer bevorzugten Ausgestaltung weisen RAM-PAEs mehrere 
paten- und Adressint erf aces, auf , sind; also als multiport- 
Anordnungen ausgebildet. Diq Ausgestaltbarkeit.-eines Daten--. 
30 und/oder Adressinterf aces als . globaien Systemport sei als 
mc5glich erwahnt. . 
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Die zusatzliche Speicherstufe (n) (RAM-Bank) konnen beispiels- 
weise durch Speicherbaugruppen entsprechend den RAM-PAEs nach 
• DE 196 54 846-2 und/oder DE 199 26 538.0 und/oder PCT/EP 
00/10516 realisiert sein. 
5 Mit anderen Worten kann eine RAM-PAE einen passiven (im we- 
sentlichen) auf die Speicherfunktion beschrankten Speicher 
(siehe DE 196 54 846.2) oder aber einen aktiven Speicher, der 
Funktionen wie z.B. Adressberechnung und/oder Buszugriffe 
. selbstandig generiert und steuert (siehe DE 199 26 538.0) 

10 darstellen. Insbesondere konnen in einer moglichen Ausgestal- 
tung auch aktive Adressgenerierungsfunktionen und/bder Daten- 
transferfunktionen fur einen 'global system port 1 implemen- 
tiert sein. Aktive Speicher konnen je nach Ausgestaltung ei- 
nen oder mehrere Daten- und Adressinterf ace aktiv (aktive In- 

15 terface) verwalten. Aktive Interface konnen beispielsweise 
durch zusatzliche Baugruppen wie beispielsweise Sequen- 
zer/Zustandsmaschinen und/oder ALUs und/oder Register, etc., 
innerhalb einer RAM-PAE realisiert sein und/oder durch die 
geeignete Verschaltung eines aktiven Interfaces mit anderen 

20 PAEs erfolgen, deren Funktion und Vernetzung entsprechend der 
zu realisierenden Funktionen in einer oder mehrerer RAM-PAEs 
. konfiguriert- Unterschiedlichen RAM-PAEs konnen unters'chied- 
liche andere PAEs zugeordnet werden. 

25. RAM-PAEs weisen bevorzugt eine oder mehrere der folgenden 
Funktionen bzw. Betriebsarten auf: random access, FIFO-, " 
Stack, Cache, MMU-paging. RAM-PAEs sind in einer bevorzugten 
Ausgestaltung iiber einen Bus mit einer iibergeordneten; Konfi- 
gurationseinhelt (CT) verbunden und kOnnen durch diese in ih- 
. 30 ' rer Funktion und/oder Vernetzung und/oder ■ Speichert.iefe - 

und/oder Betriebsart konfiguriert- werden. Weiterhin besteht 
bevorzugt die Moglichkeit, Speicherinhalte durch die CT . vor- 
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zuladen und auszulesen, z.B. urn Konstante und/oder Lookup- 
Tabellen (cos/sin) zu setzen. 

Durch die Verwendung von multi-ported Speichern ftir die RAM- 
5 PAEs kann das Einschreiben bzw. Auslesen von Daten von/zu den 
IO-FIFOs und der Datenzugriff durch das Array (PA) zeitgleich 
erfolgen, sodass die RAM- PAEs ihrerseits wiederum eine Puf- 
fer-Eigenschaft aufweisen konnen, wie beispielsweise in DE 
196 54 846.2 aufgezeigt. 

10 

RAM-PAEs konnen, wie beispielsweise in PCT/EP 00/10516 darge- 
stellt, derart zusammengefasst werden, dass grossere Spei- 
cherblocke entstehen bzw. dass die RAM-PAEs derart arbeiten, 
dass die Funktion eines grofieren Speichers entsteht (z.B. aus 
15 2 512 Wort RAM-PAEs ein 1024 Wort RAM-PAE) . 

In einer moglichen Ausfuhrung kann die Zusammenf assung derart. 
exfolgen, dass an mehrere Speicher dieselbe Adresse gefuhrt 
wird-. Die Adresse wird derart unterteilt, dass ein .Teil die • 

20 Eintrage in den Speichern adressiert und ein anderer Teil die 
Nuinmer des selektierten Speichers (SEL) angibt. Jeder Spei- 
cher besitzt eine eihdeutige Nummer und kann durch eihen Ver- • 
gleich derer mit SEL eindeutig selektieirt werden kann. In ei- 
ner bevorzugten AusfXihrung ist die Nuiomer fiir jeden Speicher 

25 konfigurierbar. 

In einer weiteren und/oder zusatzlichen" moglichen Ausfuhrung 
wird eine- Adresse von einem. Speicher zum'Nachsten weiterge- 
. leitet wird. Die Adresse wird derart untert.eilt, dass ein . . 
. 30 Teil die Eintrage in den Speichern adressiert und ein- anderer 
Teil die Nummer .(SEL) des selektierten Speichers angibt. Die- 
se wird bei jeder Weiterleitung modifiziert f beispielsweise 
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kann dieser bei jeder Weiterleitung eine l^subtrahiert wer- 
den. Der Speicher bei dem dieser Adressteil einen bestimmten 
Wert aufweist (z.B. Null), wird aktiviert. 

5 In einer moglichen Ausfuhrung kann die Zusammenf assung derart • 
erfolgen, dass an mehrere Speicher dieselbe Adresse gefuhrt 
wird. Die Adresse wird derart unterteilt, dass ein Teil die 
Eintrage in den Speichern adressiert und ein anderer Teil die 
Nummer (SEL) des selektierten Speichers angibt. Zwischen den 

10 Speichern verlauft ein Bus von jeweils einera Speicher zum 

Nachsten, der eine Ref erenzadresse derart aufweist, dass die- 
se bei dem ersten Speicher einen bestimmten Wert aufweist 
(z.B. null) und dieser bei jeder Weiterleitung modifiziert 
wird (z.B. wird eine 1 auf addiert) . Dadurch besitzt jeder 

15 Speicher eine andere eindeutige Ref erenzadresse. Der Teil der 
Adresse, die die Nummer des selektierten Speichers aufweist, 
wird jeweils mit der Ref erenzadresse verglichen. Bei Gleich- 
heit ist der betreffende Speicher selektiert. Je nach Ausge- 
staltung kann der Referenzbus iiber das gewohnliche Datenbus- 

20 system oder iiber einen separierten Bus aufgebaut sein. 

•In einer moglichen Ausfuhruhg kann jeweils eine Bereichsuber- 
prufung des Adressteils SEL erfolgen, urn Fehladressierungen 
auszuschliefien. * 

25 • 

Es sei nun darauf hingewiesen r dafi es moglich ist, die RAM-- 
PAEs als FIFOs zu benutzen. Dies kann besonders bevorzugt 
sein, wenn eine vergleichsweise graBe Speicherkapazit&t durch 
RAM-PAEs vorgesehen wird. Es entsteht somit besonders iinter 

30 Ausnutzung von multi-ported Speichern fur die RAM-PAEs die 

Ausgestaltungsmoglichkeit,. auf explizite IO-FIFOs zu verzich-- 
ten und/oder .zusatzlich zu den IO-FIFOs eine entsprechende 
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Anzahl PAE-RAMs als FIFO zu konf igurieren und die Daten der 
10 an die entsprechenden Ports der Speicher zu ftihren. Diese 
Ausgestaltung kann als besonders kosteneffizient angesehen 
werden, da keinerlei zusatzlichen Speicher vorgesehen werden 
5 nriissen, sondern die in ihrer Funktion und/oder Vernetzung 

konfigurierbaren Speicher der VPO Architektur (vgl. DE 196 54 
846 .2, DE 199 26 538.0, PCT/EP 00/10516) entsprechend des 
Charakters konf igurierbarer Prozessoren konfiguriert werden. 

10 Es ist weiter moglich, einen Multiplexer/Demultiplexer vor 
und/oder nach dem FIFO vorzusehen. Eingehende bzw. ausgehende 
Datenstrome konnen aus eineia Datensatz oder mehreren Daten- 
satzen entstehen. Beispielsweise benoti'gt die Funktion 

15 function example (a, b : integer) -> x : integer 
for i:= 1 to 100 
for j := 1 to 100 

x[i] := a[i] * b[j] 

20 zwei eingehende Datenstrome (a und b) und einen ausgehenden 
Datenstrom (x) . 

* -Die Anforderung kann z.B. durch zwei Ansatze erfullt werden: 

a) Es werden exakt so viele IO-Kanale implementiert, wie Da- 
tenstrome erforderlich sind (vgl. P 44* 16 881.0, DE 196 54 

25 595.1); in der beispielsweise angegebenen Funktion waren also 
. bereits drei I/O-Kanaie erforderlich; oder 

b) Durch die Verwendung von internen Speichern zur. Entkopp- 
lung der Datenstrome, quasi als. Registersatz {vgl. DE 199 26 
538.0, DE 196 54*846.2). Die untefschiedlichen Datenstrome 

..30- werden z-B. durch ein Zeitmultiplexverf ahren zwischen einem 
"oder mehrere Speichern und der 10 (.z.B : . Speicher, Peripherie,, 
etc) ausgetauscht. Intern .konnen die Dateri dann ggf . parallel 
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mit mehreren Speicher ausgetauscht werden, _sof em die 10- 
Daten beim Transfer zwischen dies en Speichern und der 10 ent- 
sprechend sortiert (gesplittet) werden. . 

5 Der Ansatz a) wird erf indungsgemafi dadurch untersttitzt, dass 
eine ausreichende Anzahl von IO-KanSlen und IO-FIFOs zur Ver- 
fttgung gestellt wird. Allerdings ist dieser einfache Ansatz 
unbefriedigend, da eine nicht exakt bestimmbare, algorithmen- 
abhange und zudem sehr kostenaufwendige Anzahl von IO-Kanalen 
10 zur Verfiigung gestellt werden mufl. 

Daher 1st der Ansatz b) oder eine geeignete Mischung aus a) 
und b) vorzuziehen, z.B. 2 IO-Kanale, ein Input und ein Out- 
put, wobei auf jedem Kanal die Datenstrome ggf. gemultiplext 

15 werden. Es sei darauf hingewiesen, daft einleuchtenderweise 
die Schnittstellen in der Lage sein mussen, die Datenstrome 
zu bearbeiten, also eine hinreichend hohe Taktfrequenz 
und/oder hinreichend niedrige Latenzzeiten auf den internen 
bzw. externen Bussen vorgesehen werden miissen. Dies kann der 

20 Grund sein, warum eine Mischung beider Varianten besonders 
bevorzugt ist, weil durch Vorsehen mehrerer paralleler I/O- 
Kanale die erforderliche Taktung der externen und/oder inter- 
nen Busse entsprechend herabsetzbar ist. 

25. FUr Ansatz b) bzw. Ansatze, in denen zumindest partiell auf 
Ansatz b) zuruckgegrif f en wird, ist es erforderlich Multiple- 
xer bzw.. Demultiplexer vorzusehen und die Datenstrome von ei- 
nem Datenkanal aufzutrenneh (z.B„ aus dem Input-Ranal raufi a 
und b abgetrennt werden) oder mehrere Ergebniskanale auf ei- 
. 30 nen Output-Kanal zusammenzuf tihren . • 
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Hierzu kannen ein Oder mehrere Multiplexer/ Demultiplexer 
( MuxDemux-Stuf e) an verschiedenen Positionen angeordnet wer- 
den, abhangig von der hardwaretechnischen Realisierung bzw. 
den auszuftihrenden Funktionen. Zum Beispiel kann 
5 a) eine MuxDemux-Stuf e zwischen Input-/Output-Interf ace (z.B. 
nach DE 196 54 595,1) und der FIFO-Stufe (IO-FIFO und/oder 
PAE-RAM als FIFO) 

b) eine MuxDemux-Stuf e nach der FIFO-Stufe (IO-FIFO und/oder 
PAE-RAM als FIFO) ,, also zwischen FIFO-Stufe und PA 
10 c) eine MuxDemux-Stuf e zwischen IO-FIFO und RAM-PAEs 
geschaltet werden. 

Die MuxDemux-Stufe kann ihrerseits entweder in Hardware fest 
implementiert werden und/oder durch die geeignete Konfigura- 
15 tion von beliebigen entsprechend ausgebildeten PAEs entste- 
hen. 

• Die Stellung der Multiplexer/Demultiplexer der MuxDemux-Stuf e 
wird von der Konf iguration durch eine CT und/oder dem Array 
(PA) und/oder der 10 selbst vorgegeben, wobei diese auch dy- 
20- namisch, z.B. anhand des Fullgrades des/der FIFOs und/oder 
anhand anstehender Datentransf ers (Arbitrierung) beeinf lulit 
werden kann. 

In einer bevoizugten Ausgestaltung wii^i die Multiple-. 

25 xer/Demultiplexer Struktur durch ein konfigurierbares Bussy- 
stem ausgebildet (z.B. entsprechend oder ahnlich dem Bussy- 
steras zwischen den (RAM/ALU/etc-PAEsl, wobei das Bussystem 
insbesondere' auch physikalisch dasselbe sein kann, das entwe- 
der durch- Ressourceh-Sharing oder ein Zeitmultiplex- 

30 Verfahren, das durch geeignete Rekonf iguration realisiert 
werden kann, mitben'utzt wird. 
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Besonders bevorzugt ist es, wenn Adressen auf eine besondere 
Art und Weise generiert werden, wie sich diese aus dem Nach- 
.folgenden erschlieflt. Adressen ftir interne oder externe Spei- 
cher kGnnen durch Adressgeneratoren berechnet werden. Bei- 

5 spielsweise konnen Gruppen von PAEs entsprechend konfiguriert 
werden und/oder explizite und ggf . gesondert und speziell im- 
plement ierte Adressgeneratoren (z.B. DMA wie aus DE 44 16 881 
bekannt oder innerhalb von Interface-Zellen (wie aus DE 196 
-54 595.1 bekannt) eingesetzt werden. Mit anderen Worten kon- 

10 nen entweder fest implementierte Adressgeneratoren die in ei- 
ner VPU integriert sind oder extern realisiert sind, verwen- 
det werden f und/oder die Adressen durch eine Konf iguration 
von PAEs entsprechend den Anf orderungen eines Algorithmus be- 
rechnet werden. 

15 

Vorzugsweise konnen einfache Adressgeneratoren fest in den 
Interface-Baugruppen und/oder aktiven Speicher (z.B. RAM- 
PAEs) implementiert seih. Zur Generierung komplexer Adressse- 
quenzen (z.b. nicht linear, multidimensional etc) konnen PAEs 
20 entsprechend konfiguriert und mit den Interface-Zellen ver- 
bunden werden. Derartige Verfahren mit den entsprechenden 
' Konfigurationen sind aus PCT/EP 00/10516 bekannt. 

Korifigurierte Adressgeneratoren konnen, einer anderen Konf igu- 
25 ration (Config-ID, vgl. DE 198 07 872. 2, DE 199 26 538.0, DE 
100 28 397.7) als die Dat^nverarbeitung angehoren. Damit; ist 
eine Entkopplung der Adressgenerierung von der Datenverarbei- 
- tung moglich, womit in einem bevorzugten Arbeitsverfahren 
beispielsweise Adressen bereits generiert und die entspre- 
. 30 chenden Daten bereits geladen werden konnen, bevor. oder wah- 
rend die datenverarbeitenden Konf iguration konfiguriert wird. 
Dafi ein solches Datenvorladen bzw. Adressvorgenerieren z.ur 
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Erhohung der Prozessorleistung, insbesondere durch Latenz- 
zeit- und/oder Wartetaktzyklusverringerung besonders bevor- 
zugt ist, sei erwahnt. Entsprechend konnen Ergebnisdaten und 
deren Adressen noch bearbeitet werden, wahrend Oder nachdem 
5 die datenverarbeitende/-generierende Konf iguration entfernt 
wird. Insbesondere ist es meglich, durch den Einsatz von 
Speichern und/oder Puff em wie z.B. die beschriebenen FIFOs 
die Datenverarbeitung weiter von den Speicher- und/oder 10- 
Zugriffen zu entkoppeln. 

10 

Besonders leistungsf ahig ist in einer bevorzugten Arbeitswei- 
se eine Zusammenschaltung von fest implementierten Adressge- 
neratoren (HARD-AG) (DE 196 54 595.1) und konfigurierbaren 
Adressgeneratoren im PA (SOFT -AG) derart, dass fur die Reali- 
15 sierung einfacher Adres.sierungsschematas die HARD-AG verwen- 
det werden und komplizierte Adressierungsablauf e durch die 
SOFT-AG berechnet und dann an die HARD-AG geleitet werden. 
Mit anderen Worten konnen die einzelnen Adressgeneratoren 
sich gegenseitig iiberladen und neu setzen. 

.20 

Interface-Baugruppen fur rekon£igurierbare Bausteine werden 
bereits DE 196 54 595.1 offenbart. Es wurde gefunden, dafl die 
dort offenbarten Interf ace-Baugruppen .4ind deren Betrieb noch 
25 zur Erhohung der Prozessoref fizienz und/oder Leistung verbes- 
serbar sind. Es wird daher nachfolgend im Rahmen der Erfin- 
* dung eine besondere Axisgestaltung von Interface-Baugruppen . 
vorgeschl'agen, wie sie insbesondere in DE 196 54- 595.1 offen- 
bart sind. 

30 • Jedes. Ihterf ace-Baugruppen kann eine eigene eindeutige Ken- 
nung (I0ID) besitzen, die von/zu einem Protokollkonverter 
' ubertragen wird und der Zuordnung von Datentransf ers zu einer 
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faestimmten Interface-Baugruppe oder der Adressierung einer 
bestimmten Interface-Baugruppe dient. Die IOID kann bevorzugt 
durch eine CT konfigurierbar sein. 

• Die IOID kann beispielsweise verwendet werden, urn bei Zugrif- 
5 fen durch einen externen Master eine bestimmte Interface- 

Baugruppe fur eineh Datentransfer zu selektieren. 
Weiterhin kann die IOID verwendet werden urn eingehenden Lese- 
daten die korrekte Interface-Baugruppe zuzuordnen. Dazu wird 
die IOID beispielsweise mit der Adresse eines Datenlesezu- 

10 griffes in die IO-FIFOs Obertragen und entweder dort gespei- 
chert und/oder an den externen Bus weitergeleitet. Die IO- 
FIFOs ordnen den eingehenden Lesedaten die IOIDs. der ausge- 
sendeten Adressen zu und/oder die IOIDs werden uber den ex- 
ternen Bus mitubertragen und durch externe Gerate oder Spei- 

15 cher den zuruckgesendeten Lesedaten zugeordnet. 

IOIDs konnen dann die Multiplexer (.z.B. vor den Inter face- 
Baugruppen) derart ansprechen, dass diese die eingehenden Le- 
sedaten auf die korrekte Interface-Baugruppe leiten. 

20 Fur gewohhlich arbeiten Interface-Baugruppen und/oder Proto- 

• kollkonverter als Busmaster. In einer besonderen Ausfiihrung 
wird nun vorgeschlagen, da£* Interface-Baugruppen und/oder 
Protokollkonverter alternativ und/oder fest und/oder temporar 

-als Busslave arbeiten, ihsbesondere auf .selektierbare Weise, 
.25 beispielsweise- im Ansprechen auf bestimmte Ereignisse, Zu- 
. standen von Statemachines in PAEs , Anf orderungen einer zen- 
tralen Konf igurationsverwaltungselnheit (CT) usw. 
In einer z.usatzlichen AUsfiihrung sind die Interface- 
Baugruppen derart erweitert, dass geherierten Adressen, i.b. 
30 in SOFT-AG gene'rierten Adressen, " ein bestimmtes Datenpaket 
zugeordnet wird.. 
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Eine bevorzugte Ausgestaltung einer Interface-Baugruppe ist 
nachfolgend beschrieben: 

Eine bevorzugte Kopplung eine Interface-Baugruppe erfolgt da- 
durch, dass beliebige PAEs (RAM, ALU, etc) und/oder das Array 
5 (PA) tiber einen (bevorzugt konf igurierbaren) Bus mit Inter- 
face-Baugruppen verbunden sind, welche entweder rait den Pror 
tokollkonvertern verbunden sind oder die Protokollkonverter 
integriert haben. 

In einer Ausgestaltungvariante sind IO-FIFOs in den Inter- 
10 face-Baugruppen intergriert. 

Fur Schreibzugriffe (die VPU sendet Daten an externe 10, z.B. 
Speicher/Peripherie o.a.) ist es vorteilhaft, den Adressout- 
put mit dem Datenoutput zu verknuipfen, d.h. eih Datentransfer 
15 mit der 10 findet exakt dann statt, wenn an der Interface- 
Baugruppe ein giiltiges Adresswort und ein gultiges Datenwort 
ansteht, wobei die beiden Worte von unterschiedlichen Quellen 
stammen konnen. Zur Kennzeichnung der Gultigkeit kann bei- 
spielsweise ein Haridshake-Protokoll nach DE 196 51 075-9 oder 
20 DE 101 10 530.4 (RDY/ACK) verweridet werden. Durch eine geeig- 
nete logische Verkniipfung (z.B, -- 1 AND 1 ) der RDY Signale von 
Adresswort unid Datenwort 1st das Vorhahdenseiri beider gulti- 
ger Worte erkennbar und der IO-Zugriff kann durchgefuhrt wer- 
den. Mit der Durchfuhruhg des IO-Zugriff es. kann die Quittie- 

, 25 rung der Daten- :und Adressworte erfolgen, indent das entspre- 
chende ACK ftir die beiden Transfers generiert wxrd. Der IO- 
Zugriff* bestehend aus Adresse und Daten, sowie ggf.. der dazu- 
gehorenden Statussignale kann erfindungsgemafi in Output-FIFOs 
entkopJ>elt werden. Bussteuersignale werden vorzugsweise in 

.30 den Protokollkonverterri generiert. 
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Ftir Lesezugriffe (die VPU empfangt Daten von externer 10, 
2»B. Speicher/ Peripherie o.a.) werden zun^chst die Adressen 
fur den Zugriff von einem Adressgenerator (HARD-AG und/oder 
SOFT-AG) generiert und der Adresstransf er durchgef tthrt . Die 
5 Lesedaten konnen im selben Takt oder bei hohen Frequenzen 
auch gepipelinet einen oder mehrere Takte spater eintreffen- 
Sowohl die Adressen als auch die Daten kdnnen durch IO-FIFOs 
entkoppelt werden. 

Zur Quittierung der Daten kann das bekannte RDY/ACK Protokoll 
10 verwendet werden, das auch gepipelinet verwendet werden kann. 
(siehe DE 196 54 595.1, DE 197 04 742.4, DE 199 26 538.0, DE 
100 28 397.7, DE 101 10 530.4). 

Zur Quittierung der Adressen kann ebenfalls das bekannte 
RDY/ACK Protokoll verwendet werden. Eine Quittierung der 

15 Adresse durch den Empf anger bewirkt jedoch eine sehr grofre 
Latenzzeit, die sich negativ auf die Performance von VPUs 
auswirken kann. Die Latenzzeit kann umgangen werden, indem 
die Interface-Baugruppe den Empfang der Adresse quittiert und 
die Synchronisation des Eingangs der der Adresse zugeordneten 

20 ' Daten mit dem Adresse abernimmt. 

'Die Quittierung und Synchronisation' kann durch eine beliebige 
g'eeignete Quittierungs-Schaltung erfolgen. ' Zwei mdgliche Aus- 
gestaltungen seien im Foigenden riibhtTJLimitierend naher aus- 
25 gefiihrt: 

a) FIFO % * 

Ein FIFO speichert die ausgehenden Adress'zyklen der externen 
•Bustransfers. Mit jedent als Antwbrt auf einen externen Buszu- 
9^£f£ eingehenden Datenwort- wird der FIFO entsprechend ge- 
.30- lehrt. Durch den \ FIFO-Character entspricht die Reihenfolge 

der ausgehenden Adressen der Reihenfolge der ausgehenden Da- 
tenworte. Die Tiefe des FIFOs (also die Zahl der moglichen' 
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EintrSge) wird vorzugsweise an die Latenzzeit des externen 
Systems angepafit, sodass jede ausgehende Adresse ohne Latenz 
quittiert werden kann und der optimale Datendurchsatz er- 
reicht wird. Eingehende Datenworte werden entsprechend des 
5 FIFO-Eintrages der zugeordneten Adresse quittiert. Wenn der 
FIFO voll ist, kann das externe System keine weiteren Adres- 
sen mehr annehmen und die aktuelle ausgehende Adresse wird so 
lange nicht quittiert und damit gehalten, bis Datenworte ei- 
nes vorhergehenden Bustransfers eingegangen sind und ein FI- 
10 FO-Eintrag entfernt wurde. 1st der FIFO leer r wird kein gal- 
tiger Bustransfer ausgeftihrt und ggf . eintreffende Datenworte 
werden nicht quittiert. 
b) Credit counter 

jede ausgehende Adresse von externen Bustransfers wird- quit- 
15 tiert und zu einem Zahler dazuaddiert (Creditcounter) . Einge- 
hende Datenworte als Antwort auf einen externen Bustransfer 
werden werden von dem Zahler abgezogen. Erreicht der Zahler 
einen definierten Hochstwert, kann das externe System keine 
weiteren Adressen mehr annehmen und die aktuelle ausgehende 
20 Adresse wird so lange nicht quittiert und damit gehalten, bis 
Datenworte eines vorhergehenden Bustransfers eingegangen sind 
■ urid der zahler dekrementiert wurde. 1st der Zahlerstand hull, 
wird kein gtiltiger Bustransfer ausgeftihrt und ggf. eintref- 
fende Datenworte werden . nicht quittiert. 
. 25 Urn Bursttransfers optimal- zu unters'tutzen wird die Losung 
mittels a) (FIFO) besondeirs bevorzugt, insbesondere konnen 
FIFOs ahnlich den nachfolgend beschriebeneri FIFOs zur Abwick- 
• lung von Burstzugrif fen und der Zuordnung von KKEDszu den 
Lesedateh eingesetzt werden. ' 

.30- 
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In die Interface-Baugruppen konnen die beschriebenen IO-FIFOs 
integriert sein. Insbesondere kann fttr die Ausgestaltungsva- 
riante a) auch ein IO-FIFO verwendet werden. 

5 Es wurde vorstehend schon die optionale Moglichkeit offen- 
bart, Protokollkonverter vorzusehen. Zu besonders vorteilhaf- 
ten moglichen Ausgestaltungen von Protokollkonvertern sei das 
Nachfolg.ende angemerkt: 

10 Ein Protokollkonverter ist fur die Verwaltuhg und Steuerung 
eines externen Busses zustandig. Detailaufbau und -funktion 
eines Protokollkonverter sind von der Ausgestaltung des ex- 
ternen Busses abhangig. Beispielsweise erfordert ein AMBA Bus 
einen anderen Protokollkonverter als ein RAMBUS . Unterschied- 

15 liche Protokollkonverter sind an die Interface-Baugruppen an- 
schliefibar r innerhalb einer Ausgestaltung einer VPU konnen 
mehrere und insbesondere unterschiedliche Protokollkonverter 
implement iert sein. 

In einer bevorzugten Ausgestaltung sind die Protokallkonver- 
20 ter in den 10 FIFOs der vorliegenden Erfindung integriert. 

•Es ist erfindungsgemafi moglich,. Burst -Buszugriffe vorzsehen. 
Moderne Bussystem und SoC-Bussysteme transferieren grofie Da- 
tenmengen mittels sogenannter Burst-Sequenzen. Dabei wird z'u- 
25 nachst eine Adresse Obertragen und damv fur- .eine Anzahl von 
Takten ausschlieMich Daten transf eriert (siehe AMBA Specific 
cation 2.0, ARM Limited)'. 

Zur korrekten Dur.chfuhrung von Burst-Zugrif f en sind mehrere 
30 Aufgaben zu losen: 

1) Erkennen von Burst zyklen 
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Lineare Buszugriffe, die in Bursts umgewandelt werden konnen, 
mtissen erkannt werden, um Bursttransfers auf dem externen Bus 
auszulosen. Zur Erkennung linearer Adressfolgen kann ein ZSh- 
ler (TCOUNTER) eingesetzt werden, der zunachst mit einer er- 

5 sten Adresse eines ersten Zugriffes geladen wird und nach je- 
dem Zugriff linear auf/ab zahlt. Sofern die darauffolgende 
Adresse dem Zahlerstand entspricht liegt eine lineare und 
burstfahige Reihenfolge vor. . 
.2) Abbruch an Boundaries 

10 Manche Bussysteme (z.B. AMBA) lassen Bursts (a) nur bis zu 
einer bestimmten L&nge, bzw. (b) nur bis zu bestimmten 
Adressgrenzen (z.B. 1024 Adress Blocke) zu. Fur (a) kann dann 
erfindungsgemaii ein einfacher Zahler implementiert werden, 
der vom ersten gewtinschten bzw. erforderlichen Buszugriff an 

15 die Anzahl der DatenObertragungen zahlt und bei einem be- 
stimmten Wert, der der maximalen Lange des Bursttransfers 
entspricht, z.B. mittels eines Vergleichers die Boundarygren- 
ze signalisiert . Fur (b) kann das entsprechende Bit (z.B. fur 
1024 Adress Grenzen das 10. bit), das die Boundarygrenze dar- 

20 stellt, zwischen TCOUNTER und der aktuellen Adresse vergli- 
chen werden (z.B. mittels einer XOR Funktion) . 1st das Bit in 
TCOUNTER ungleich dem Bit in der aktuellen Adresse lag ein 
ttbergang uber eine Boundarygrenze vor f der entsprechend si- 
gnalisiert wird. 

25 3) Festlegen der Lange 

Spf ern das externe Bussystem keine Angabe zur Lange eines 
Burst zyklus benotigt, is-t es moglich und erf indungsgemafi be- 
vorzugt, Bursttransfers unbestimmter' Lange durchzufuhren 
(vgl. AMBA) . Werden Langen^ngaben erwartet und/oder bestimmte 

30 Burstlangen vorgegeben, .kann erf indungsgemafi folg.endermaSen 
vorgegangeh werden: Die zu ubertragenden Dateri und Adressen 
werden in ein FIFO bevorzugt unter Mitverwendung des IO-FIFOs 
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dafiir, geschrieben und sind anhand der Anzahl der Adressen im 
(IO-)FIFO bekannt. Fur die Adressen wird ein Adress-FIFO ver- 
wendet, das im Mastermodus die Adressen von den Interface- 
Baugruppen zum externen Bus iibertragt und/oder im Slavemodus 
5 umgekehrt arbeitet. Die Daten werden in ein Daten- FIFO ge- 
schrieben, das die Daten entsprecherid der Obertragung 
(Schreiben/Lesen) iibertragt. Insbesondere kann fur Schreib 
und Lesetransfers je ein unterschiedliches FIFO verwendet 
werden. Die Bustransfers konnen nunmehr derart in fixe Burst- 

10 langen unterteilt werden, dass diese vor den einzelnen 

Bursttransfers bekannt sind und bei der Einleitung der' Burst 
angegeben werden konnen, wobei vorzugsweise zunachst Bu- 
stransfers der maximalen Burstlange gebildet werden und wenn 
die Anzahl der verbleibenden (IO-) FIFO-Eintrage kleiner als 

15 die aktuelle Burstlange ist jeweils eine nachst kleinere 
Burstlange verwendet wird. Beispielsweise konnen 10 (10- 
) FIFO-Eintrage bei einer maximalen Burstlange von 4 mit 4,4,2 
Bursttransfers Obertragen werden* 
4). Error Recovery 

20 Manche externen Bussysteme (vgl. AMBA) sehen Verfahreri zur 
Fehlerbeseitigung vor,' wobei beispielsweise fehlgeschlagene 
Bustransfers wiederholt werden. Die Information ob ein. Bu- 
stransfer fehlgeschlagen, ist wird am Ende eines Bustransfers 
ubertragen, quasi als Quittung far den Bustransfer. Urn einen 

25 Bustransfer zu wiederholen ist es nunmehr erforderlich, dass 
samtliche Adressen und bei Schreibzugrif fen auch die wegzu- 
schreibenden Daten noch zur Verfiigung- stehen.. ErfindungsgemaB - 
wird im HinblicJc hierauf vorgeschlagen, dazu die Adress-FIFOs- 
(bevorzugt die AdressvFtFOs der 10- FIFOs) derart zu. modif i- - 

30 zieiren, dass der Lesezeiger vor jedem Bursttransfer gespei- 
chert wird- Es ist somit ein-FIFO- 

Lesezeigerpositionsspeichermittel r insbesondere ein Adrefi- 
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FIFO-Leserzeigerpositionsspeichermittel vorgesehen. Dieses 
kann einen integralea Teil des Adress-FIFOs bilden, in dem 
beispielsweise ein Flag vorgesehen wird, das anzeigt, dafi ei- 
ne im FIFO abgelegte Information eine Lesezeigerposition dar- 

5 stellt, oder es kann separat zum FIFO vorgesehen werden. Al- 
ternativ konnte auch vorgesehen werden, den im FIFO abgeleg- 
ten Daten einen die Loschbarkeit anzeigenden Status zuzuord- 
nen, der mitabgelegt ist und diesen Status auf „loschbar" zu- 
riickzusetzen, sofern die erfolgreiche Datenubertragung quit- 

10 tiert wurde. Sofern ein Fehler auftrat, wird der Lesezeiger 
wieder auf die zuvor gespeicherte Position gesetzt und der 
Bursttransfer wiederholt. Trat kein Fehler auf, wird der 
nachste Bursttransfer durchgefuhrt und der Lesezeiger ent- 
sprechend neu gespeichert. Urn zu verhindern, dass der 

15 Schreibzeiger in einen aktuellen Bursttransfer gelangt und 
damit Werte iiberschrieben werden, die evtl. bei einer Wieder- 
holung des Bursttransfers noch benotigt werden, wird der 
Vollzustand der FIFOs durch den Vergleich des gespeicherten 
Lesezeigers mit dem Schreibzeiger festgestellt . 

20 

IO-FIFOs und/oder die FIFOs zur Verwaltung von Bursttransfers 
konnen bevorzugt jeweils mit der von den Interface-Baugruppen 
bekannten Funktion der Adress zuordnung. zu eingehenden Leseda- 
ten erweitert sein. Dabei kann den eingehenden Lesedateri auch 
25 die IOID. zugeordnet werden, die bevorzugt zusammen mit den 
Adressen in den FIFOs gespeichert wird. Durch die- Zuordnung 
der. IOID zu eingehenden Lesedaten ist die Zuordnung- der. Lese- 
daten zu den entsprechenden Interface-Baugruppen moglich, in- 
dent" beispielsweise die Multiplexer entsprecherxd der IOID ge- 
.,30 schaltet werden. 
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ErfindungsgemaB 1st es moglich, bestimmte Bussysteme zu ver- 
wenden und/oder Bussysteme auf unterschiedliche Weise auszu- 
gestalten. Dies wird nachfolgend erortert. Ausgestaltungsab- 
hangig konnen zwischen den einzelnen Einheiten, insbesondere 
5 den Interface-Baugruppen, den 10- FIFOs, den Protokollkonver- 
tern unterschiedliche Bussysteme zum Einsatz kommen, wobei 
zwischen je zwei Einheiten ein anderes Bussystem implemen- 
tiert sein kann. Unterschiedliche Ausgestaltungen sind imple- 
mentierbar, wobei die Funktionen mehrere Ausgestaltungen in- 
10 nerhalb einer Ausgestaltung zusaramengef afit sein konnen. 

Einige Ausgestaltungsmdglichkeiten sind nachfolgend aufge- 
ftthrt. 

Die einfachste mogliche Ausgestaltung ist die direkte Verbin- 
dung von zwei Einheiten. 
15 In einer erweiterten Ausfuhrung liegen Multiplexer zwischen 
den Einheiten, die unterschiedlich ausgestaltet sein konnen. 
Dies Ausfuhrung wird besonders bei der Verwendung mehrere der 
jeweiligen Einheiten bevorzugt. 

Eine Multiplex-Funktion kann durch einen konf igurierbaren Bus 
20 entstehen f der von. einer ubergeordenten Konf igurationseinheit 
(CT) jeweils fur einen Zeitraum fur die Verbindung bestimmter 
Einheiten untereinander konfiguriert werden kann. 
In einer bevorzugen Ausfuhrung sind die Verbindungen durch 
Selektoren f die beispiels.weise einen fceil einer Adresse 
25 . und/oder eine IOID dekodieren, definiert f indem diese die 
Multiplexer zur Verschaltung der Einheiten ansteuern. 
In einer besonders bevorzugten Ausfuhrung sind die Selektoren 
derarf ausgestaltet, dass mehrere Einheiten zugleich, eine an- 
dere Einheit- selektieren konnen, wobei in zeitlicher Reihen- 
30 folge jeweils eine der Einheiten. zur Selektion arbitriert 
. wird. Ein beispielsweise geeignetes Bussystem ist in DE 199 
26 538.0 beschrieben. 
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Fur die Arbitrierung konnen zusatzliche Zustande verwendet 
werden. Beispielsweise konnen Datentransfers zwischen den In- 
terface-Baugruppen und den IO-FIFOs folgendermassen optimiert 
5 werden: 

Jeweils ein Block einer definierten Grofie von zu transferie- 
renden Daten wird innerhalb der FIFO-Stufen zusammengefaBt . 
Sobald ein Block voll/leer ist wird dem Arbiter ein Buszu- 
griff signalisiert, urn die Daten zu Ubertragen. Die Daten 

10 werden in einer Art Burst-Transfer ubertragen, d.h. der ge- 
samte Datenblock" wird wahrend einer Buszuteilungsphase durch 
den Arbiter ubertragen. Mit anderen Wort en, kann eine Buszu- 
teilung bedingt durch FIFO-Zustande der angeschlossenen FIFOs 
erfolgen, wobei innerhalb eines FIFOs Datenblocke zur Zu- 

15 standsbestimmung verwendet werden konnen. Ist ein FIFO voll, 
kann er den Bus zur Entleerung arbitrieren; ist ein FIFO 
leer, kann er den Bus. zur Fiillung arbitrieren. Zusatzliche 
Zustande konnen vorgesehen sein, beispielsweise in- Flush, der 
zur Entleerung nur teilweise voller FIFOs und/oder zur Ful- 

20 lung nur teilweise leerer FIFOs verwendet wird. Ein Flush 

kann beispielsweise bei einem Konf igurationswechsel (Rekonfi- 
guration) verwendet werden. 

In einer bevorzugten Ausgestaltung siijd die Bussysteme um ho- 
25 he Datentransfer- und Taktraten zu erreichen durch geeignete 
R^gisterstufen als Pipelines aufgebaut und konnen beispiels- 
weise selbst als FIFO arbeiten. 

In einer bevorzugten Ausgestaltung kann die Multiplexerstuf e 
30 ebenfalls gepipelinet* ausgestaltet sein. 
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ErfindungsgemSfi ist es mdglich, mehrere Module an eine 10 an- 
zuschliefien und eine Kommunikation der Module untereinander 
vorzusehen. Hierzu sei Folgendes angemerkt:- 
Aus DE 198 07 872.2, DE 199 26 538.0, DE 100 28 397.7 sind 
5 Konfigurat ions -Module bekannt, die eine bestimmte Funktion 
beinhalten, die wiederverwertbar und/oder innerhalb des PA 
relokatierbar sind. 

Mehrere dieser Konf igurat ions -Module konnen abhangig und/oder 
unabhangig voneinander zugleich in . das PA konfiguriert wer- 
10 den . 

Die Konfigurations-Module miissen auf eine. limitferte und.ins- 
besondere typischerweise nur an bestimmten Stellen vorgesehe- 
ne und daher nicht relokatierbare 10, derart verschaltet wer- 
den, dafi die Konfigurations-Module die 10 zugleich benutzen 
15 konnen und die Daten den korrekten Modulen zugeordnet werden. 
Weiterhin mussen zusainmengehorende (abhangige) Konfigura- 
tions-Module derart miteinander zu verschaltet werden, daft 
eine freie Relokation der Konfigurations-Module untereinander 
im PA moglich ist. 

20 

Durch die gewohnlichen Netzwerke* (P 44. 16 881.0, 02, 03, 08) 
ist ein" derart flexibler Aufbau' zumeist nicht moglich, da 
dieses Netzwerk ublicherweise ntittels eines Routers explizit 
alloziiert und geroutet werden itiufi. 

25 

In DE 197 Q4 742.4 ist ein Verfahren beschrieben/ urn flexible 
Datenkanale innerhalb einer. PAE-Matrix entsprechend der aus- 
• zufiihrenden Algorithmen, so auf zubauen, dafi eine direkte Ver- 
• bindung durch- eine und entsprechend einer DatenObertragung 
30 entsteht und danach wieder abgebaut wird. Die ubextragenden 
Daten konnen jeweils exakt einer Quelle und/oder einem Ziel 
zugeordnet werden. 
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Zusatzlich und/oder alternativ zu DE 197 04 742.4 und der 
dbrt beschriebenen Vorgehensweise und den dort beschriebenen 
Anordnungen sind nun erf indungsgemaJS weitere Moglichkeiten 

5 gegeben und Verf ahren (nachfolgend zusammengefaJSt mit Global- 
Track bezeichnet) einsetzbar, die eine flexible Alloziierung 
und Vernetzung zur Laufzeit ermoglichen, z.B. serielle Busse, 
parallele Busse, Lichtleiter mit jeweils geeigneten Protokol- 
len (z.B. Ethernet, Firewire, USB) . Es soil ausdriicklich auf 

10. die Ubertragung per Licht durch ein . lichtleitendes Substrat 
insbesondere bei geeigneter Modulation zur Trennung der Kana- 
le hingewiesen werden. Eine weitere Besonderheit der Erfin- 
dung mit Bezug auf die Speicheradressierung, insbesondere die 
Moglichkeit des Paging und MMU sei nachfolgend diskutiert. 

15 

Die Datenkanale eines odere mehrerer GlobalTrack konnen uber 
' Vermittlungs-Knoten mit einem gewohnlichen Netzwerk bei- 
spielsweise nach P 44 16 881.0, 02, 03, .08 verbunden werden. 
Die Vermittlungs-Knoten konnen je nach Implementierung unter- ; 
20 schiedlich im PA angeofdnet sein, beispielsweise jeder PAE, 
einer Gruppe und/oder Hierarchie von PAEs und/oder jeder n- 
ten PAE zugeordnet sein. 

In einer besonders bevorzugten Ausgestaltung weisen samtliche 
PAEs, Interface-Baugruppen,' etc* einer), dedizierten Anschlufi 
25- . auf einen GlobalTrack auf 

"Ein Konfigurations-Modul wird derart gestaltet, da-fi es Zu- 
griff auf einen oder. mehrere dieser Vermittlungs-Knoten er- 
halt. - - ■ 

30 . Mehrere Konfigurations-Module untereinander und/oder Konfigu- 
rations-Module und. IOs lassen sich nunmehr iiber den Global- 
Track miteinander verbinden. Bei entsprechender Implementie- 
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rung (z.B. DE 197 04 742.4) lassen sich mehrere Verbindungen . 
gleichzeitig aufbauen und benutzen. Die Verbindung zwischen 
Sendern und Empfangern kann adressiert erfolgen, sodass ein 
individueller Datentranfer ermoglicht wird. Mit anderen Wor- 
5 . ten sind Sender und Empfanger uber den GlobalTrack identifi- 
zierbar. Damit lassen sich ttbertragene Daten eindeutig zuord- 
nen. 

Mittels einer erweiterten 10, die die Sender und Empfan- 
geradresse mit tibertragt - wie beispielsweise aus DE 101 10 
10 530.4 bekannt - und der Multiplexing-Verf ahren nach DE 196 54 
595.1/ k5nnen Daten fur unterschiedliche Module tiber die IO 
iibertragen werden und sind ebenfalls eindeutig zuzuordnen. 

Der Datentransfer wird in einer bevorzugten Ausgestaltung 
. 15 synchronisiert beispielsweise iiber Handshake-Signale . Weiter- 
• hin kann der Datentransfer gepipelinet also iiber mehrere im 
GlobalTrack implement iert;en oder diesem zugewiesenem Regi- 
stern erfolgen. In einer sehr komplexen Ausfuhrung fur .grofte 
VPU's bzw. deren Vernetzung untereinander, kann ein Global- 
20 Track in einer Netzwerktopologie mit Switches und Routers 
aufgebaut sein beispielsweise kann Ethernet eingesetzt wer- 
den. 

Dafi verschieden Medien fur GlobalTrack Topologien verwendet 
werden konnen, z.B; das Verf ahren . nacfy DE 197 04 742.4 fiir 
25 VPU-interne Verbindungen und Ethernet, fur Verbindungen zwi- 
schen VPtfs, sei erwahnt. 

Speicher (z.B- RAM-PAEs) konnen mit einem MMU Mhnlichen Page- 
ingverf ahren ausgestattet- sein. Beispielsweise. kann dadurch 
30 ein grofier externer Speicher in Segmente (Pages) zerlegt wer- 
den, die im Falle eines Datenzugrif f s innerhalb eines Segmen- • 
tes in eirien der internen Speicher geladen und zu einem spa- 
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teren Zeitpunkt nach Beendigung des Datenzugif f es wieder in 
den externen Speicher geschrieben werden. 

In einer bevorzugten Ausgestaltung werden an einen (internen) 
Speicher geleitete Adressen in einen Adressbereich, der in- 
5 nerhalb des internen Speichers (MEMADR) liegt (z.B. die unte- 
ren.10 bit bei einem 1024 Eintrage Speicher), und eine Sei- 
tenadresse (die Bits oberhalb der unteren 10) zeriegt. Die 
GrdAe einer Seite/Page ist somit durch MEMADR bestimmt. 

10 Die Seitenadresse wird mit einem dem internen Speicher zuge- 
ordneten Register (Seitenregister) verglichen. Das Register 
speichert den Wert der Seitenadresse, die zuletzt aus einem 
ubergeordneten externen (Haupt-) Speicher in den internen 
* Speicher transferiert wurde. 

15 Stimmt die Seitenadresse mit dem Seitenregister tiberein, kann 
ein wahlfreier Zugriff auf den internen Speicher stattfinden. 
Sofern die Adresse nicht ttbereinstimmt (Pagefault) wird der 
aktuelle Seiteninhalt an die Stelle die durch das Seitenregi- 
ster angegeben ist vorzugsweise linear in den externen 

20 (Haupt-) Speicher geschrieben. 

Der an der Stelle der aktuellen neuen Seitenadresse beginnen- 
de Speicherbereich im externen (Haupt-) Speicher (Seite/Page) 
wird in den internen Speicher geschrieben. 

25 In einer besonders bevorzugten Ausfvihrung kann durch Konfigu- 
ration vorgegeben werden, ob bei einem Pagefault die neue 
Seite aus dem externen (Haupt-) Speicher in den internen Spei- 
cher ubertfagen werden soli oder nicht. 

In einer besonders bevorzugten Ausfuhrung kann" durch konfigu- 
30' ration vorgegeben werden, ob bei einem Pagefault die alte 
Seite von dem internen Speicher in den externen (Haupt- 
) Speicher tibertragen werden soil oder nicht. 
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Der Vergleich der Seitenadresse mit dem Seitenregister er- 
folgt bevorzugt innerhalb des betreffenden Speichers. 
Die Datentransfersteuerung bei Pagefaults kann durch beliebi- 
5 ge PAEs entsprechend konfiguriert werden und/oder durch DMAs 
{z.B. in den Interface-Baugruppen oder externe DMA) erfolgen. 
In eines besonders bevorzugten Ausftihrung sind die internen 
Speicher als aktive Speicher mit integrierter Datentransfer- 
steuerung ausgelegt (vgl. DE 199 26 538.0). 

io 

In einer weiteren mSglichen Ausftihrung kann ein interner 
Speicher mehrere (p) Pages aufweisen, wobei die Gr5fle einer 
Page dann bevorzugt der Speichergrofie geteilt durch p be- 
tragt. Eine Obersetzungstabelle (Translation Lookaside Buffer 

15 = TLB) , die bevorzugt ahnlich eines voll assoziativen Caches 
ausgestaltet ist, ersetzt das Seitenregister und iibersetzt 
Seitenadressen auf Adressen im internen Speicher, mit anderen 
Worten kann eine virtuelle auf eine physikalische Adresse 
iibersetzt werden. Ist eine Page nicht in der Obersetzungsta- 

20 belle (TLB) beinhaltet tritt ein PageFault auf. Weist die 
Obersetzungstabelle keinen Platz fur neue zusatzliche Pages, 
auf, konnen Pages aus dem internen Speicher in den externen 
(Haupt-) Speicher Obertragen und aus der Obersetzungstabelle 
entferht werden, sodass wieder Freiraijin im internen Speicher 

25 zur Verftigung steht. 

Es soil iausdrucklich. darauf hiagewiesen werden, dass sich ei- 
ne detailliertere Ausftihrung eriibrigt, da eine Vielzahl per 

• * -. 

se bekannter MMU-Verfahren nach dem Stand der Technik ein- 
30 setzbar ist und mit geringfiigigen und of fensichtlichen Modi- 
fikationen einsetzbar ist. 
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Es wurde bereits vorstehend die Moglichkeit erwahnt, einen 
sogenannten Collectorspeicher vorzusehen. Hierzu sei nunmehr 
noch detaillierter Folgendes ausgeftthrt: 

Zwischen die Interface-Baugruppen und die IO-FIFOs kann ein 
5 Sammelspeicher (Collector) geschaltet werden, der grSBere Da- 
tenmengen speichern kann. 

Der Collector kann zum Austausch von Daten zwischen den In- 
terface-Baugruppen, bzw. zwischen Speichern die dem Array zu- 
geordnet sind (z.B. RAM-PAEs) verwendet werden. 
10 Der Collector kann als Puffer zwischen den Daten innerhalb 

eines rekonf igurierbaren Bausteins und externen Daten verwen- 
det werden. 

Ein Collector kann als Puffer von Daten zwischen unterschied- 
lichen Rekonf igurationsschritten dienen, beispielsweise kann 
15 er die Daten unterschiedlicher Konf igurationen speichern, 

wahrend andere Konfigurationen gerade konf iguriert und aktiv 
' sind. Bei der Deaktivierung von Konfigurationen speichert er 

• deren Daten und die Daten der nunmehr neu konfigurierten und 
aktiven Konfigurationen werden, werden zum PA, z.B. in Spei- 

20 chern die dem Array zugeordnet sind (RAM-PAEs), ubertragen. 

• Eine Mehrzahl von Interface-Baugruppen kann Zugriff auf den 
Collector haben und Daten in jeweils getrennten und/oder ge- 
meinsam zugreifbaren Speicherbereichen, verwalten. 

25 In einer bevorzugen Ausges.taltung kann der Collector mehrere 
AnschlQsse fttr Interface-Baugruppen aufweisen, auf die zeit- 
gieich zugegriffen werden kann (cLh. er wird als Multi-Port- 
Collectprmittels ausgebildet) , 

Der Collector besitzt einen oder mehrere Anschlusse an einen 
.30 externen Speicher und/oder die externe Peripherie. Diese kon- 
rien insbesondere mit den IO-FIFOs verbunden sein. 
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In einer erweiterten Ausgestaltung konnen der VPO zugeordne- 
ten Prozessoren wie DSPs, CPUs, Mikrokontroller auf den Col- 
lector zugreifen. Dies erfolgt bevorzugt tiber ein weiteres 
Multi-Port Interface. 
5 In einer bevorzugten Ausgestaltung ist dem Collector eine 
Adressabersetzungstabelle zugeordnet. Jedes Interface kann 
eine eigene Adressiibersetzungstabelle Oder alle Interface ei- 
ne gemeinsame Adressabersetzungstabelle besitzen. Die Adress- 
iibersetzungstabelle kann von dem PA und/oder einer CT 

10 und/oder einer externen Einheit verwaltet werden. Die Adress- 
abersetzungstabelle dient der Zuordnung von Collector Spei- 
cherbereichen zu beliebigen Adressen und arbeitet ahnlich ei- 
nem MMU-System. Ist ein Adressbereich (Page) nicht innerhalb 
des Collector vorhanden (pagemiss) , kann dieser- Adressbereich 

15 aus eineiti externen Speicher in den Collector geladen werden. 
• Weiterhin ' konnen Adressbereiche (Pages) aus dem Collector in 
den externen Speicher geschrieben werden. 
Zum Datentransfer zum bzw. zwischen dem externen Speicher 
. wird bevorzugt. eine DMA verweridet. Der DMA wird ein Speicher- 

20 bereich innerhalb des Collector zur lesenden oder schreiben- 
den Obertragung angegeben, die entsprechenden Adressen im ex- 
ternen Speicher konnen separ.at angegeben werden oder bevor- 
zugt von der DMA aus der Adressabersetzungstabelle entnommen 
werden; 

25 

Ein Collector und dessen Adressgeneratoren (z.B. DMA) konnen 
bevorzugt entsprechend oder ahnlich per se bekannter MMU- 
Systeme far Prozessoren nach dem Starid der Technik a,rbeiten. 
Adressen konnen mi.t tibersetzungstabelieri (TLB) fur einen Zu- 
. 30 griff auf den Collector abersetzt werden. Samtliche far in- 
terne Speicher beschriebenen MMU-Ausgestaltungen und Verf ah- 
ren konnen erfindungsgemafi auf einen Collector angewendet 
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werden. Auf die Arbeitsweisen wird nicht n|her eingegangen, 
da diese dem Stand der Technik entsprechen oder sehr ahnlich 
sind. 

5 In einer erweiterten bzw. bevorzugten Ausgestaltung konnen 
mehrere Collectoren implementiert sein. 

Es ist erfindungsgemafl moglich, die Speicherzugrif fe zu opti- 
mieren. Hierzu sei Folgendes angemerkt: 

.10 • 

Eine Grundeigenschaf t der bevorzugen rekonfigurierbaren VPU 
Architektur PACT-XPP ist die Moglichkeit Rekonf iguration und 
Datenverarbeitung zu uberlagern (vgl. P 44 16 881.0, DE 196 
51 075.9, DE 196 54 846. 2,. DE 196 54 593.5, DE 198 07 872.2, 
15 DE 199 26 538.0,. DE 100.28 397.7, DE 102 06 857.7). Mit ande- 
iren Worten kann 

a) z.B. w£hrend einer Datenverarbeitung bereits die nachste 
Konf iguration vorgeladen werden und/oder 

b) z.B. wahrend eine Anzahl von konfigurierbaren Elementen 
20 einer bestimmten Konf iguration noch nicht konfiguriert sind, 

bzw. gerade konfiguriert werden, die Patenverarbeitung in an- 
deren bereits konf igurierten Elementen bereits beginnen- 
und/oder 

■ c) z.B. die Konf iguration verschiedert^r Aktivitaten derart 
25 . entkoppelt oder tiberlagert werden-, dass diese unter optimaler 
Performance gegenieinander zeityersetzt ablaufen (vgl. 8.1 
Adressgenerierung) 

Moderne Spe.icherprotokolle (z.B. SDRAM, DDRAM,- RAMBUS) weisen 
30 zumeist folgenden oder einen in der Wirkung ahnlichen Ablauf 
auf, wobei Schritt 2 und 3 evtl. auch umgekehrt auftreten: 
1. Initialisierung eines Zugriffes mit Adr'essahgabe 
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2. Lange Latenzzeit 

3. Schnelle Obertragung von Datenblocken zumeist als Burst 

Diese Eigenschaft kann in der VPU Technologie performance- 
5 effizient ausgenutzt werden. Beispielsweise ist es moglich, 
die Schritte der Berechnung der Adresse (n) , der Initiallisie- 
rung des Speicher-Zugrif f es, des Datentransfer und der Daten- 
verarbeitung im Array (PA) jeweils derart zu trennen, dass 
verschiedene (zeitliche) Konf igurationen entstehen, wodurch 
10 eine weitgehend optimale ttberlagerung der Speicherzyklen und 
der Datenverarbeitungszyklen erreicht werden kann. Mehrere 
• der Schritte konnen je nach Anwendung auch zusammengefasst 
sein. 

Folgendes Verfahren entspricht beispielsweise diesem Prinzip: 
15 Es soil die Applikation AP ausgeftihrt werden, die aus einer 
Vielzahl von Konf igurationen (ap=l, 2, . . . , z) besteht. Weiter- 
hin werden auf der VPU weiter Applikationen/Konf igurationen 
ausgeftihrt, die unter WA zusammengefafit sind 

1. zunachst werden' (in einer ap. Konfiguration von AP) die 
20 Lese-Adressen berechnet, die Datentransfers und die IO-FIFOs 

initialisiert, 

2. die fur AE tibertragenen und irizwischen in den IO-FIFOs 
vorhanden- Daten werden (in. einer ap+1.. Konfiguration) verar- 
beitet und ggf . in FIFOs / Puffer / Zwischenspeicher / etc. 

25 abgelegt, 

2a. die Berechnung der Ergebnisse kann mefhrere Kbnfigurati- 
onszyklen (n) erfordern, an deren Ende die Ergebnisse in .ei- 
nenu IO-FIFO gespeichert sind. 

3. die Adressen .der Ergebnisse werden berechnet und der D'a- 
30 tentransfer initialisiert; diss. kann parallel odef spater- in 

derselben oder einer ap+n+2. Konfiguration erfolgen, zugleich 
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Oder zeitlich versetzt werden dann die Daten aus den IO-FIFOs 
in die Speicher geschrieben. 

Zwischen den Schritten k5nnen beliebige Konfiguration aus WA 
ausgeftthrt werden, z.B. wenn zwischen den Schritten eine War- 
5 tezeit notwendig ist, da Daten noch nicht zur Verfugung ste- 
hen. - 

Ebenfalls konnen wahrend der Schritte parallel zu der Verar- 
beitung von AP Konf igurationen aus WA ausgefuhrt werden, z.B. 
wenn AP die fur WA benotigten Ressourcen nicht verwendet. 

10 

Es ist dem Fachmann of fensichtlich, dass unterschiedlich mo- 
difiz.ierte Ausgestaltungen des Verfahrens moglich sind. 



In einer m6glichen Ausgestaltung kann das Verarbeitungsv^r- 
15, fahren folgendermassen ablaufen (Z markiert einen Konfigura- 
tionszyklus, bzw. eine Zeiteinheit) : 



z 


Konfiguration AP 


andere Konfigura- 
tionen (WA) 






beliebige andere 
Konf igurationen 
und/oder Daten^ 
verarbeitungen, 
Schreib/le'se- 
vprgSnge mit IO- 
FIFOs- und/oder 
RAM-PAEs in ande- 
ren oder iiber 
Konf igurat idrts zy- 
klen zeitgemulti- 
plexten Ressour- 
cen^ . 


1 


Leseadressen berechnen, Zugrif f in- . 
itialisierfen 


2 


Daten einlesen 


3+k 


Daten verarbeiten 

(ggf . in mehrereri (k) Konfigurations- 
zyklen) 


4fk 


Schreibadressen berechnen, Zugriff in- 
itialisieren 


5+k 


Daten ausschreiben 
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Dieser Ablauf kann insbesondere von dem Datenverarbeitungs- 
verfahren nach DE 102 02 044.2 effizient genutzt werden. 

5 Die vorstehenden Verfahren und Vorrichtungen werden bevorzugt 
betrieben unter Verwendung besonderer Compiler, die gegentiber 
herkSmmlichen Compilern besonders erweitert sind. Hierzu sei 
. Folgendes angemerkt: 

10 Zur Generierung von Konf igurationen werden Compiler einge- 
setzt die auf einem beliebigen Rechnersystem ablaufen. Typi- 
sche Compiler sind z.B. C-Compiler. und/oder fur die VPU Tech- 
nologie z.B. auch NML-Compiler . Besonders geeignete Compiler- 
verfahren sind in z.B. DE 101 39 170.6, DE 101 29 237.6, EP - 

15 02 001 331.4 beschrieben. 

Der Compiler soli bevorzugt folgende Besonderheiten zumihdest 

partiell beachten: 

Trennung der Adressierung in 

1. externe Adressierung, also die Datentransfers mit exter- 
20 nen Baugruppen 

2. interne Adressierung, also die Datentransfers zwischen 
PAEs, i.b. zwischen RAM- PAEs und ALU-PAEs 

3 . Desweiteren soil die zeitliche Entkopplung besondere Be- 
achtung finden. 

25 

Bustransfers werden in interne und externe Transfers zerlegt. 
btl) Externe Lesezugriffe werden separiert, in einer mogli- 
chen Ausfahrung auch in eine separate Konf iguration aber- 
setzt. Die Daten werden von einem externen Speicher in einen 
. .^30 internen transf eriert. 
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bt2) Interne Zugriffe werden mit der Datenyerarbeitung gekop- 
pelt, d.h. die internen Speicher werden far die Datenverar- 
beitung gelesen, bzw. beschrieben. 

bt3) Externe Schreibzugrif f e werden separiert, in einer mSg- 
5 lichen Ausftihrung auch in eine separate Konf iguration tiber- 
setzt. Die Daten werden von einem internen Speicher in einen 
externen transferiert. 

Wesentlich ist, dass die btl, bt2-, bt3 in unterscheidliche 
10 Konfigurationen ubersetzt werden konnen und diese ggf . zu ei- 
nem unterschiedlichen Zeitpunkt ausgefiihrt werden. 

Das Verfahren soil an dem nachfolgenden Beispiel verdeutlicht 
werden: 

15 

function example (a, b : integer) -> x : integer 
for 1:= 1 to 100 
for j:= 1 to 100 

x[i] := a[i] * b[j] 

20 

Die.Funktion wird vom "Compiler- in drei Teile, bzw. Konfigura- 
tionen (subconfig) transf ormiert : 

example#dload:. Lad die Daten von extern { Speicher , Periphe- 
rie/ etc.) und schreibt diese in interne Speicher. Interne 
25 Speicher sind mit r# und dem Namen der ursprunglichen Varia- 
ble gekennzeichnet . 

• example#process:. Entspricht der eigentlichen Datenverarbei- * 
tung.. Diese liest die* Daten aus internem Operandeh und 
schreibt die Ergebnisse wieder in interne Speicher. 
.30 exampie#dstore :' schreibt die. Ergebnisse aus dem internen 
Speicher nach extern (Speicher, Peripherie, etc.). 
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function example* (a f b : integer) -> x : integer 
subconfig example#dload 
for i := 1 to 100 

r#a[i] := a[i] ' 
5 for j := 1 to 100 

r#b[j] := b[j] 

subconfig examplefprocess 
for i := 1 to 100 
10 for j:= 1 to 100 

r#x[i] := r#a[±] * r#b[j] 

subconfig exampietdstore 

• for i := 1 to 100 
15 . x[i] := r#x[i] 

Ein wesentlicher Effekt des Verfahrens ist, dass anstatt i*j 
= 100 * 100 = 10.000 externe Zugriffe nur i+j = 100 + 100 = 
200 externe Zugriffe zum Lesen der Operanden ausgefuhrt wer- 
20 den. Diese Zugriffe sind zudem noch vollkommen linear, was 
die Transfergeschwindigkeit bei modernen Bussystemen (Burst) 
und/oder Speichern (SDRAM, DDRAM, RAMBUS, etc) erheblich be- 
schleunigt . 

• Die internen Speicher zugriffe erfolgerx parallel, da den Ope- 
25 randen unterschiedliche Speicher zugewiesen wurden. 

Zum Schreiben der Ergebnisse sind i = 100 externe Zugriffe 
notwendig, die ebenfalls wieder linear mit maximaler Perfor- 
mance* erfolgen k5nnen„ 

30 Wenn die Anzahl der Datentransf ers vorab nicht bekannt ist 

(z.B. WHILE-Schileifen) Oder, sefrr grofi ist, kann ein. Verf ahren 
verwendet werden, das bei Bedarf durch Unterprogrammaufruf e . 
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die Operanden nachlad bzw. die Ergebnisse nach extern 
schreibt. Dazu kSnnen in einer bevorzugten Ausftihrung (auch) 
die Zustande der FIFOs abgefragt werden: 'empty 1 wenn das FI- 
FO leer ist r sowie 'full' wenn das FIFO voll ist. Entspre- 
5 chend der Zustande reagiert der Programmf lufi . Zu bemerken 
ist, dass bestimmte Variablen (z.B. ai, bi, xi) global defi- 
niert sind. Zu Performanceoptimierung kann ein Scheduler ent- 
sprechend der bereits beschriebenen Verfahren die Konfigura- 
tionen example#dloada, example#dloadb bereits vor dem Aufruf 
10 von example#process bereits ausfiihren, sodass bereits Daten 
vorgeladen sind- Ebenso kann example#dstore (n) nach der Ter- 
minierung von example#process noch .aufgerufen werden urn r#x 
zu leeren. 

15 subconfig example#dloada (n) 
while !full(r#a) AND ai<=n 
r#a[ai] := a[ai] 
ai++ 

20 subconfig example#dloadb (n) 
while !full(r#b) AND bi<=n 
r#b[bi] := b[bi] 

bi++ - • 

25 subconfig examplei#dstore (n) • 
while ! empty (r#x) AND xi<=n 
x[xi] := r#x[xi]" 
xi++ 

30 subconfig example#process 
for i := 1 to n 
for j := 1 to m 
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if empty (r#a) then example#dloada(n) 
if empty (r#b) then example#dloadb (m) 
if full(r#x) then examplefdstore (n) 

5 r#x[i] := r#a[i] * r#b[j] 

bj := 1 

Die Unterprogrammaufruf e und das Verwalten der globalen 
Variablen sind ftir rekonfigurierbare Architekturen 

10 vergleichsweise aufwendig. Daher kann in einer bevorzugten 
Ausfiihrung die nachfolgende Optimierung durchgefuhrt werden, 
in welcher samtiiche konf igtirationen weitgehend unabangig ab- 
laufen und nach vollstandiger Abarbeitung termini.eren (termi- 
nate) . Da die Daten b[j] mehrfach erforderlich sind, mufi ex- 

15 ample#dloadb entsprechend mehrfach durchlaufen werden. Dazu 
werden beispielsweise zwei Alternativen dargestellt: 
Alternative 1: example#dloadb terminiert nach jedem Durchlauf 
und wird von exampletprocess fur jeden Neustart neu konfigu- 
riert. 

20 ' Alternative 2: example#dloadb lauft unendlich und wird von 
example#process terminiert. 

Wahrend 'idle' ist eine Konf iguration untatig (wartend) . 

25 subconfig examplefdloada (n) 
for i:= 1 to n 
while full(r#a). 

idle 
r#a[i] := a[i] 
30 terminate 

subconfig example#dloadb(h) 



WO 02/071248 



PCT/EP02/02398 



while 1 // ALTERNATIVE 2 
for i:= 1 to n 
while full(r#b) 

idle ■ 
5 r#b[i] := a[i] 

terminate 

subconfig example#dstore (n) 
for i:= 1 to n 
10 while empty (r#b) 

idle 
x[i] := r#x[i] 
terminate 

15 subconfig example#process 
for i :« 1 to n 
for j := 1 to m 

• while empty (r#a) or empty (r#b) or full(r#x) 
idle 

•20 r#x[i] := r#a[i] * r#b[j] 

config example#dloadb(n) // ALTERNATIVE 1 
terminate exampieidloadb (n) // ALTERNATIVE 2 
terminate 

25 

Zur Vermeidung von Wartezykl'en Jconnen Kbnf igurationen auch 
terminiert werden, sobald sie ihre Aufgabe temporar nicht 
weiter erf alien konnen. Die entsprechende Kbnf iguration wird 
von dem rekonf igurierbaren Baustein entfernt,. verbleibt je- 
30 doch im Scheduler. Hierzu wird im Folgenden der Befehl 'reen- 
ter 1 verwendet. Die relevanten Variablen werden vor der Ter- 
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minierung gesichert und bei der wiederholten Konf iguration 
wiederhergestellt : 

subconfig example#dloada (n) 
5 . for ai:= 1 to n 

if full(r#a) reenter 
r#a[ai] := a[ai] 
terminate 

10 subconfig example#dloadb{n) 
while 1 // ALTERNATIVE 2 
for bi:= 1 to n 

if full(r#b) reenter 
r#b[bi] ":'= a[bi] 
15. terminate 

subconfig example#dstore (n) 
for xi:= 1 to n 

if empty (r#b) reenter 
20 x[xi] := r#x[xi] 

terminate 

subconfig example#process 
for i := 1 to n 
25 for j :.= 1 to m 

if empty (r#a) or empty (r#b) or full(r#x) reenter 
r#x[i] := r#a[i] '* r#b[j] 
confiQ exampleidloadb(n) // ALTERNATIVE 1 
terminate exampleidloadb (n) // ALTERNATIVE 2 
30 . terminate 
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Zu dem vorstehenden und weiteren sei auf die MQglichkeit hin- 
gewiesen, erf indungsgemafi einen sogenannten „Kontext-Switch* 
vorzusehen. Hierzu sei Folgendes angemerkt: 

5 Der wiederholte Start von Konf igurationen, beispielsweise 
„reenter u erfordert das Sichern und Wiederherstellen von lo- 
kalen Daten (z.B. ai, bi, xi) . Bekannte Verfahren nach dem 
Stand der Technik sehen explizite Interface zu Speichern oder 
zu einer CT vor, um die Daten zu transferieren. Samtliche 
10' dieser Verfahren sind inkonsistent und/oder benbtigen zusatz- 
liche. Hardware. 

Der erfindungsgem&fie Kontext Switch wird derart durchgefiihrt, 
dass eine erste Konf iguration entfernt wird, die zu sichern- 
• den Daten verbleiben in den entsprechenden Speichern (REG) 

15 (Speicher, Register, Zahler, etc) . 

Eine zweite Konf iguration wird geladen, diese verbindet die 
REG in geeigneter Weise und def inierter Reihenf olge mit einem 
oder mehreren globalen Speicher (n). 
. Die Konfiguration kann- beispielsweise Adressgeneratoren ver- 

20 wenden, um auf den/die globalen Speicher zuzugreifen. 

Die' Konfiguration kann* beispielsweise Adressgeneratoren ver- 
wenden um auf als Speicher ausgestaltete REG zuzugreifen. 
Entsprechend der konf igvirierten Verbindung zwischen den REG 
werden die Inhalte der REG in einer d§£ inierten Reihenfolge 

25 in den globalen Speicher geschrieben, wobei die jeweiligen 

Adressen von Adressgeneratoren vorgegeben werden. Der Adress- 
generator generiert die Adressen fur den/die globalen Spei- 
cher (n) derart, dass die beschriebenen Speicherbereiche (PUS- 
HAREA) der entfernten ersten Konfiguration eindeutig zugeord- 

30 net werden konnen. 

Mit anderen Worten, es sind bevorzugt fur unterschiedliche 
Konf igurationen unterschiedliche Adressenraume vorgesehen. 
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Die Konfiguration entspricht einem PUSH gewShnlicher Prozes- 
soren. 

Danach verwenden andere Konfigurationen die Ressourcen. 

5 

Die erste Konfiguration soli wieder gestartet werden. Zuvor 
wird eine dritte Konfiguration gestartet, die die REG der er- 
sten Konfiguration in einer definierten Reihenfolge miteinan- 
. der verbindet. 

10 Die konfiguration kann beispielsweise Adressgeneratoren ver- 
wenden um auf den/die globalen Speicher zuzugreifen. 
Die Konfiguration kann beispielsweise Adressgeneratoren ver- 
wenden um auf als Speicher ausgestaltete REG zuzugreifen. 

15 Ein Adressgenerator generiert Adressen derart, dass ein kor- 
rekter Zugrif f auf die der ersten Konfiguration zugeordnete 
PUSHAREA erfolgt. Die generierten Adressen und die konfigu- 
rierte Reihenfolge der REG sind derart, dass die Daten der 
REG in der urspriinglichen Ordnung aus den Speichern in die 

20 REG geschrieben werden. Die Konfiguration entspricht einem 
POP gewohnlicher Prozessoren. 

Die erste Konfiguration wird wieder gestartet. 

Zusammengef afit wird ein Kontext Switch derart durchgefiihrt, 
25 dass durch das Laden besonderer Konfigurationen, die ahnlich 
von PUSH/POP bekannter Prozessorarchitekturen arbeiten, die • 
zu sichernden Daten rn.it einem globalen Speicher ausgetauschen 
werden. 

30 Es besteht weiter die Moglichkeit, * einen besonderen Task- 
Switch bzw. Multikonfigurationshandling vorzusehen.- 
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In einer bevorzugten Arbeitsweise kdnnen unterschiedliche Da- 
tenblocke unterschiedlicher Konf igurationen partitioniert 
werden. Auf diese Partitionen kann zeitoptimiert zugegriffen 
werden, indem beispielsweise wShrend der Ausfuhrung einer 

5 Konfiguration Q ein Teil der Operanden einer nachfolgenden 
Konfiguration P aus externen (Haupt-) Speichern und/oder son- 
stigen (peripheren) Datenstromen in. die internen Speicher 
vorgeladen werden und wShrend der Ausfuhrung von P die Ergeb- 
nisse von Q als Teil des Gesamtergebniss^s aus den internen 

10 Speichern an externe (Haupt-) Speicher und/oder sonstige (pe- 
ripheren) DatenstrSme geschrieben werden. 

Die Funktionsweise unterscheidet sich erheblich von der in 
US6, 341,318 beschriebenen. Ein Datenstrom oder Datenblock 
wird bevorzugt durch eine FIFO-Struktur entkoppelt (z.B. 10- 
15 FIFO) . Unterschiedliche Datenstrome oder Datenblocke insbe- 
sondere unterschiedlicher Konfigurationen werden bevorzugt 
durch unterschiedliche Speicher und/oder FIFO-Bereiche 
und/oder Zuordnungsmarkierungen in den FIFOs entkoppelt. 

20 Die zuvor beschriebenen optionalen MMU-Verfahren konnen zum 
Entkoppeln und. Puf fern externer Daten verwendet werden. 
In einer Anwendungsweise kann ein grofier externen Datenblock 
in. mehrere Segmente zerteilt werden, die jeweils innerhalb 
einer VPU verarbeitet werden konnen. 

25 In einer zusStzlichen bevorzugten Arbeitsweise konnen unter- 
schiedliche Datenblocke unterschiedlicher Konfigurationen 
entsprechend des vofstehend erklarten Verfahrens in Partitio 
nen zerteilt werden, die nurimehr als Pages fur eine MMU defi 
niert werden. Auf diese kann zeitoptimiert zugegriffen wer- 

30 den, indem beispielsweise wahrend der Ausftthrung einer Konfi 
guration Q im PA die Operanden einer nachfolgenden Konfigura 
tion P als Page aus externen (Haupt-) Speichern und/oder son- 
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stigen (peripheren) Datenstromen in die internen Speicher 
vorgeladen werden und wahrend der Ausfuhrung von P die Ergeb- 
nisse von Q als Page aus den internen Speichern an externe 
(Haupt-) Speicher und/oder sonstige (peripheren) Datenstrdme 
5 geschrieben werden. 

Fur die vorstehenden Verfahren werden bevorzugt interne Spei- 
cher, die mehrere Partitionen bzw. Pages verwalten kSnnen 
eingesetzt. 

10 Die Verfahren konnen fur PAE-RAMs und/oder Collector-Speicher 
eingesetzt werden. 
. Bevorzugt werden Speicher mit mehrere Businterfaces verwendet 
(multi-port), um einen gleichzeitigen Zugriff von MMUs 
und/oder des PAs und/oder weiterer Adressgeneratoren/ Daten- 

15 transfereinrichtungen zu einoioglichen. 

In einer Ausgestaltung werden Kennungen bei den Datentrans- 
fers mitiibertragen, die eine Zuordnung von Daten zu einer 
Resssource und/einer Applikation ermoglichen. Beispielsweise 
20 kann das in DE 101 10 530.4 beschriebene Verfahren angewendet 
werden. Unterschiedliche Kennungen konnen auch gleichzeitig 
verwendet werden. 

In einer besonders bevorzugten Ausfiihrung wird eine Applika- 
t ions kennungen (APID) bei jedem Datentfansfer mit den Adres- 

25 sen und/oder Daten mitiibertragen. Eine Applikation besteht 
aus mehreren Konfigurationen. Anhand der APID werden die 
iibertragenen Daten einer Applikation bzw. den fur eine Appli- 
• kation bestimmte Speichern oder anderen Ressourcen (z.B. 
. PAEs f Busse, etc) .zugewiesen. Zu diesem Zweck konnen die : 

30 APIDs unterschiedlich verwendet werden. 

Beispielsweise konnen Interf ace-Baugruppen entsprechend von 
APIDs selektiert werden. 
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Beispielsweise konnen Speicher entsprechend von APIDs selek- 
tiert werden. 

Beispielsweise konnen PAEs entsprechend von APIDs selektiert 
■ werden. 

5 Beispielsweise konnen Speichersegmente in internen Speichern 
(z.B. PAE-RAMs, Collector (en) ) durch APIDs zugewiesen werden, 
Dazu kdnnen die APIDs Shnlich eines Adressteils in eine einem 
internen Speicher zugeordneten TLB eingetragen werden, womit 
ein bestimmter Speicherbereich (Page) abhMngig von einer APID 

10 zugewiesen und selektiert wird. 

Durch dieses Verf ahren entsteht -die Moglichkeit, Daten unter- 
schiedlicher Applikationen innerhalb einer VPU ef fizient zu 
verwalten und auf diese zuzugreifen. 

Optional besteht die Moglichkeit, explizit Daten bestimmter 
15 APIDs zu loschen (APID-DEL) und/oder an externe (Haupt- 
) Speicher und/oder sonstige (peripheren) Datenstrome zu 
schreiben (APID-FLUSH) .' Dies kann jeweils erfolgen, wenn eine 
Applikation terminiert. APID-DEL und/oder APID-FLUSH konnen 
durch eine Konf iguration und/oder durch eine iibergeordnete 
20 Ladeeinheit (CT) und/oder von extern ausgelost werden. 

' Das folgende Verarbeitungsbei spiel soil das Verf ahren ver- 
deut lichen: 

Eine Applikation Q (z.B. APID = Q) kann aus einer Konfigura- 
25 tion zum Lesen der Operanden (z.B. ConfigID = j), einer Kon- 
' figuration zum Verarbeiten der Operanden (z.B. ConfigID = 
w)und einer Konf iguration zum Schreiben den Ergebnisse (z.B. 
ConfigID = s) bestehen. 

Die Konf iguration j wird zuerst ausgefuhrt, um'zeitlich opti- 
30 mal ehtkoppelt die Operanden zu lesen. Gleichzeitig konnen 
Konfigurationen anderer Applikationen ausgefahrt werden. Die 
Operanden werden entsprechend" der Kennung APID "aus externen 
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(Haupt-) Speichern und/oder sonstigen (peripheren) Datenstr6- 
men in bestimmte interne Speicher und/oder Speicherbereiche 
geschrieben. 

Die Konfiguration w wird ausgefiihrt, urn die gespeicherten 
5 Operanden zu verarbeiten. Dazu wird unter Angabe von APID auf 
die entsprechenden Operanden in den internen Speichern 
und/oder Speicherbereiche zugegriffen, Ergebnisse werden ent- 
sprechend unter der Angabe von APID in interne Speicher 
und/oder Speicherbereiche geschrieben. Gleichzeitig konnen 

10' Konf igurationen anderer Applikationen ausgefiihrt werden. . 
Abschliefiend schreibt die Konfiguration s die gespeicherten 
Ergebnisse aus den den internen Speichern und/oder Speicher- 
bereiche an externe (Haupt-) Speichern und/oder sonstige (pe- 
ripheren) Datenstrome. Gleichzeitig konnen Konf igurationen 

15 anderer Applikationen ausgefiihrt werden. 

Insoweit entspricht der Grundablauf des Verfahrens dem vorab 
beschriebenen zur Optimierung von Speicherzugrif f en. 

Sind Daten ftir eine bestimmte APID nicht in den Speichern 
20. vorhanden oder ist kein Speicherplatz fttr diese Daten mehr 
frei, kann ein Pagefault zur Ubertragung der Daten ausgelost 
werden. 

WMhrend vorstehend zunachst von einem ..Baustein ausgegangen 
25 wurde, bei dem ein Feld rekonf igurierbarer Elemente mit al- 
lenfalls geririger zusatzlicher Beschaltung wie Speichern, FI- 
FOs und derglei'chen vorgesehen wird, ist'es. auch moglich, die 
erfindungsgemaJJen Ideen zu Verwenden fur Systeme, die als 
^systems on a Chip" (SoC) bezeichnet' werden. Fur SoCs sind 
30 die Begriffe „intern" und „extern w nicht vollstandig in ihrer. 
herkommlichen T'efminologie anwendb'ar, etwa wenn beispielswei- 
se eine VPU mit weiteren Baugruppen (z.B. Peripherie, andere 
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Prozessoren und insbesondere Speichern) auf einem einzigen 

Chip gekoppelt bzw. verkoppelt sind. JSs kann dann folgende 

Begrif f sdef inition gelten, wobei ersichtlich sein wird, dafi 

diese nicht schutzbeschrankend aufzufassen ist, sondern nur 
5 beispielhaft angibt, wie sich die Ideen der vorliegenden Er- 

findung unproblematisch auf Konstrukte lesen lassen, die her- 

kommlich eine andere Terminologie verwenden: 
• intern: Innerhalb einer VPU Architektur, bzw.. zur VPU Archi- 

tektur und IP gehorende Bereiche 
10 extern: Aufierhalb einer VPU Architektur, d.h.. alle sonstigen 

Baugruppen z.B. Peripherie, anderen Prozessoren und i.b. 

Speicher) auf einem SoC und/oder aufterhalb des Chips in dem 

sich die VPU Architektur befindet. 

15 Es sei nun eine bevorzugte Ausgestaltung beschrieben: 

In einer besonders bevorzugten Ausgestaltung werden datenver- 
arbeitenden PAEs lokal im PA (z.B.. ALUs, Logik, etc.) ange- 
. ordnet und verknupft. RAM- PAEs konnen lokal im PA eingebunden 

20 sein, sind allerdings in einer besonder3 bevorzugten Ausge- 
staltung von dem PA abgesetzt oder an dessen Randern ange- 
bracht (vgl. DE 100 50 442.6). Dies erfolgt, um die Homogeni— 
tat des PA bei groften RAM-PAE Speichern, deren Flachenbedarf 
weit grGfier als der von ALU-PAEs ist, ,4iicht zu storen und. 

25 aufgrund eines far gewohnlich stark unterschiedlichen Gat- 

ter /Transistor-Layouts (z.B, GDS2) von Speicher zellen. Sofern 
die RAM-PAEs dedizierte AnschlUsse an ein externes Bussys.tem 
(z.B. globaler Bus) aufweisen, sind sie aus Layout-, Floor- 
plan- und Herstellungs-Grunden bevorzugt an den Randern eines 

30 PA angeordnet. 

Typischerweise wird zur physikalischen Anbiridung das konf igu- 
' rierbare Bussystem des PA verwendet. 
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In einer erweiterten Ausgestaltung weisen PAEs und Interface- 
Baugruppen, sowie ggf . weitere konfigurierbare Baugruppen ei- 
nen dedizierten Anschlufi an einen dedizierten globalen Bus 
z.B. einen GlobalTrack auf. 

5 

Interface-Baugruppen und insbesondere Protokollkonverter wer- 
den bevorzugt vom PA abgesetzt und ausserhalb derer Anordnung 
plaziert. Dies erfolgt, um die Homogenitat des PA nicht zu 
stGren und aufgrund eines fttr gewohnlich stark unterschiedli- 

10 chen Gatter/Transistor-Layouts (z.B. GDS2) des Interface- 

Baugruppen/Protokollkonverter.- Desweiteren sind die Anschltis- 
.se an externe Einheiten aus Layout-, Floorplan- und Herstel- 
lungs-GrOnden bevorzugt an den Randern eines PA angeordnet. 
Die Anbindung der Interface-Baugruppen an das PA erfolgt be- 

15 vorzugt uber das konfigurierbare Bussystem der PA, an dessen 
aufieren Randern die Interface-Baugruppen angebunden werden. 
Das Bussystem erlaubt konf iguirierbar den Datenaustausch zwi- 
schen Interface-Baugruppen und beliebigen PAEs innerhalb des 
PA; mit anderen Worten innerhalb einer Oder unterschiedlicher 

20 Konfigurationen konnen Interface-Baugruppen z.B. mit RAM-PAEs 
verbunden sein, andere Interface-Baugruppen konnen beispiels- 
weise mit ALU- PAEs verbunden sein. 

Die IO-FIFOs werden bevorzugt in das Protokollkonverter inte- 
griert. Dm eine hohere Flexibilitat in. der Zuordnuhg der in- 
25 ; ternen Datenstrome an die externen zu ermoglichen/ sind die 
Interface-Baugruppen und Protokollkonverter getr.ennt ausge- 
staltet und mittels eines konfigurierbare Bussystems verbun- 
den. 

30 Die Erfindung wird im Folgenden nur beispielsweise in nicht 
limitierender Weise unter Bezugnahme auf die Zeichnung noch 
. einmal erlautert . 
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Figur 1 zeigt einen besonders bevorzugten Aufbau eines rekon- 
figurierbaren Prozessors, bestehend aus einem Kern (Array PA) 
(0103) beispielsweise bestehend aus einer Anordnung von ALU- 

5 PAEs (0101) (zur Durchfiihrung von Berechnungen) und RAM-PAEs 
(0102) (zum Speichern) und entspricht damit dem Grundprinzip 
nach DE 196 54 846-2. Wie bevorzugt befinden sich die RAM- 
PAEs nicht lokal im Kern integriert, sondern von den ALU-PAEs 
abgesetzt an den Randern oder ausserhalb des Kerns. Dies er- 

10 folgt, urn die Homogenitat des PA bei grofien RAM-PAE Spei- 
chern, deren Flachenbedarf weit groBer als der von ALU-PAEs 
ist, nicht zu storen und aufgrund eines fur gewohnlich stark 
unterschiedlichen Gatter /Transistor-Layouts (z.B. GDS2) von 
Speicherzellen. Sofern die RAM-PAEs dedizierte Anschltisse an 

15 ein externes Bussystem (z.B. dediziter globaler Bus; Global- 
Track; etc.) aufweisen, sind aus Layout-, Floorplan- und Her- 
stellungs-Grunden bevorzugt an denRSndern eines PA angeord- 
net . 

Die einzelnen Einheiten sind ttber Bussysteme (0104) miteinan- 
20 der verbunden. An den Randern des Kernes befinden sich Inter- 
facebaugruppen ( Interface -Baugruppen und ggf . Protokollkon- 
verter) (0105) ahnlich DE 196 54 595.1 zu externen Bussen 
(10) . Die Inter facebaugruppen konnen implementierungsabhSngig 
unterschiedlich ausgestaltet sein und ..beispielsweise eine 
25 oder . mehrere der folgenden Funktionen erf alien: 

1. Zusanimenfiahren und synchronisieren von mehreren Bussy- 
stemen, urn beispielsweise Adressen und Daten zu synchro- 
nisieren 

2. Adressgeneratoren und/oder DMAs 

30 3. FIFO Stufen zur Entkopplung der Daten und/oder Adressen 
4 . Inter f acecontrollern (z.B. ftir AMBA-Bus, RAMBUS, 
RapidIO, USB, DDRRAM, etc) 
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Figur 2 zeigt unterschiedliche Ausgestaltung dei: erfindungs- 
gemafien Architektur. 0201 stellt eine Anordnung von ALU-PAEs 
(PA) dar, die mit mehreren RAM- PAEs (0202) gekoppelt sind. 
5 Ober FIFOs (0203) sind externe Busse (IO) (0204) angeschlos- 
sen. 

Figur 2a zeigt eine direkte FIFO zu PA Kopplung. 

10 In Figur 2b ist die IO (0204) uber die RAM-PAEs (0202) mit 
0201 verbunden. Die Verbindung erfolgt dabei typischeweise 
Uber das konf igurierbare Bussystem 0104 oder ein dediziertes 
Bussystem. Multiplexer/Demultiplexer (0205) schalten eine 
Vielzahl von Bussen (0104) auf die IO (0204). Die Multiplexer 

15 werden durch eine Konfigurationslogik und/oder Adressselek- 
tierlogik und/oder einen Arbiter (0206) angesteuert. Die An- 
steuerung der Multiplexer kann beispielsweise auch durch das 
PA erfolgen. . 

20 Figur 2c entspricht Figur 2b, jedoch sind vor die 10 noch FI- 
FOs (0203) geschaltet. 

. Die Darstellungen in den Figuren 3 entsprechen den Figuren 2, 
.weshalb dieselbeh Referenzen verwendet. sind. .Figur 3 verdeut- 
25*. lich das bevorzugte Dateriverarbeitungverfahren in einer VPU. 
Figur 3a: Daten gelangen Ober die IO (0204) in eipen Ein- 
gangs-FIFO (0303 entsprechend 0203) und werden von diesem in 
das PA (0201) und/oder. zuvor in Speicher 0202 geladen. 

.30 Die Figuren 3b-e zeigen die . Datenausfuhrung, bei welcher Da- 
ten zwischen- den Speichern ilbertragen werden. Wahrend dieser 



WO 02/071248 



PCT/EP02/02398 



Zeit kSnnen die FIFOs weiterhin Eingangsdaten (0301) und/oder 
Ausgangsdaten (0302) tibertragen. 

In Figur 3f werden Paten aus dem PA und/oder aus den Spei- 
5 chern in in den Ausgangs-FIFO (0304) geladen. 

Es soil nochmals darauf hingewiesen werden, dass das Einlesen 
von Daten aus dem Input-FIFO in die RAM-PAEs Oder 0201 und 
das Schreiben von Daten aus 0201 oder den RAM-PAEs zeitgleich ■ 
10 geschehen kann. 

Ebenfalls soil darauf hingewiesen werden, dass die Input - 
/Output-FIFOs wahrend der Schritte a-f kontinuierlich externe 
Daten empfangen bzw. senden kcmnen. 

15 Figur 4 zeigt dasselbe Verfahren in einer leicht modifizier- 
ten Fassung, bei welcher Multiplexer/Demultiplexer (0401) zur 
' einf achen Datenverteilung zwischen die FIFOs und 0201 ge- 
schaltet sind. Die Multiplexer werden durch eine Konfigurati- 
onslogik und/oder Adressselektierlogik und/oder einen Arbiter- 

20 (0402) angesteuert. 

Mehrere Konf igurationen finden fur die Datenverarbeitung 
statt (a-e) . 

Die Daten konnen aus den FIFOs (Input-FIFOs) in Speicher 
und/oder direkt (0403) in das PA eingelesen werden. Wahrend 
25 des Einlesevorganges konnen Daten aus dem PA und/oder Spei- 
chern in FIFOs (Output-FIFOs) geschrieben werden (0404). Zur 
Datenausgabe konnen Daten aus den Speichern und/oder direkt 
(0405) aus dem PA an die FIFOs geschrieben werden. Wahrend- 
dessen konnen neue' Daten aus den Input-FIFOs an Speicher 
. 30 und/oder das PA geschrieben (0406) werden. 

Das Einschreiben neuer Daten (0407) kann beispielsweise be- 
reits wahrend einer letzten Konf iguration erfolgen. 
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wahrend der gesamten Verarbeitung konnen Daten von extern in 
die Input-FIFOs ubertragen (0408), bzw. von den Output-FIFOs 
nach extern ubertragen (0409) werden. 

5 Figur 5 zeigt eine mdgliche Ausgestaltung einer PAE. Ein er- 
stes Bussystem (0104a) ist mit einer Datenverarbeitungeinheit 
* (0501) verbunden deren Ergebnisse auf ein zweites Bussystem 
(0104b) Ubertragen werden. Der vertikale Datentransfer wird 
liber zwei Register-/Multiplexerstufen (FREG 0502, BREG 0503) 

10 mit je unterschiedlicher Obertragungsrichtung gefuhrt. In die 
FREG/BREG kennen bevorzugt einfache ALUs beispielsweise fur 
Addition, Subtraktion und Multiplexoperationen integriert 
sein. Ober ein zusatzliches Interface (0504) wird die Einheit 
in ihrer Funktion und Vernetzung von einer Konf igurationsein- 

15 heit (CT) konf iguriert, in einer bevorzugten Ausgestaltung 
besteht die Moglichkeit Konstanten in Register und/oder Spei- 
cher fur die Datenverarbeitung zu setzen. In einer weiteren 
Ausgestaltung kann eine Konf igurationseinheit (CT) Daten aus 
den Arbeitsregistern und/oder Speichern auslesen. 

20 In einer erweiterten Ausgestaltung kann eine PAE zusatzllch 
einen AnschluB an einen dedizierten globalen Bus (0505) (z.B. 
einen GlobalTrack) aufweisen und damit beispielsweise direkt 
mit einem globalen ggf . auch externen Speicher und/oder Peri- 
pherie kommunizieren. Desweiteren kanrx ein globale Bus derart 

25 ausgestaltet sein, dass unterschiedliche PAEs direkt uber 
diesen miteinander und in einer bevorzugten Ausfuhrung auch 
mit Baugruppen fttr einen externen Anschlufi (z.B. Interface- 
Baugruppen) kommunizieren konnen. Ein Bussystem wie bei- 
spielsweise in DE 197 04 742.4 beschrieben kann fur derartige 

30 Zwecke eingesetzt werden. 
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Die Datenverarbeitungeinheit (0501) kann beispielsweise fttr 
ALU-PAEs als arithmetisch logische Einheit (ALU) ausgestaltet 
sein. Dnterschiedliche ALU-PAEs kSnnen unterschiedliche ALUs 
und Busauf schaltsysteme verwenden. Beispielsweise kann eine 
5 .ALU raehr als 2 Busverbindungen zu 0104a und/oder 0104b auf- 
weisen. 

Die Datenverarbeitungeinheit (0501) kann beispielsweise fiir 
RAM-PAEs als- Speicher ausgestaltet sein. Unterschiedliche 

10 RAM-PAEs kGnnen unterschiedliche Speicher und Busauf schaltsy- 
steme verwenden. Beispielsweise kann ein Speicher mehrere 
i.b. mehr als 2 Busverbindungen zu 0104a und/oder 0104b auf- 
weisen urn beispielsweise den Zugriff mehrere Sender/Empf anger 
auf einen Speicher zuzulassen. Die Zugriffe konnen bevorzugt 

15 auch gleichzeitig erfolgen (Multi-Port) . 

Die Funktion des Speichers umfafit beispielswiese folgende 
Funktionen oder Kombinationen daraus; Random Access , FIFO, 
Stack, Cache, Page Memory mit MMU-Verf ahren. 

Desweiteren kann in einer bevorzugt en Ausfiihrung der Speicher 
20 mit Daten von der CT vorgeladen werden (z.B. Konstanten, Loo- 
kup-Tabellen, etc) . Ebenf alls kann die CT in einer erweiter- 
ten Ausfiihrung Daten (z.B. zum Debuggen oder fur Taskwechsel) 
aus dem Speicher iiber 0504 zurticklesen. 

In e.iner weiteren Ausfiihrung kann die JIAM-PAE einen dedizier-. 

25 ten Anschluft (0505) an einen global.en Bus aufweisen, Der glo- 
bale Bus verbindet mehrere PAEs untereinander und in einer 
bevorzugten Ausfiihrung audi mit Baugruppen £ur einen externen 
Anschluli (z.B. Interface-Baugruppen).. Fur ein derartiges Bus- 
system kann das in DE 197 04 742.4 beschriebene System ver- 

:30 , wendet werden. . 

RAM-PAEs konnen derart zusammengeschaltet werden, dass aus 
mehreren (n) RAM-PAEs ein n-fach grofierer Speicher entsteht. 
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Figur 6 zeigt eine beispielhafte Verschaltung von ALU-PAEs 
(0601) und RAM-PAEs (0602) iiber Bussysteme 0104. Eine bevor- 
zugte Verschaltung far einen rekonf igurierbaren Prozessor ist 
5 in Figur 1 dargestellt. 

Figur 7 zeigt eine einfache Ausgestaltungsvariante einer 10- 
Schaltung entsprechend 0105. Es werden Adressen (ADR) und Da- 
ten (DTA) zusanutien rait Synchronisationsleitungen (RDY/ACK) 
10 zwischen den internen Bussystemen (0104) und einem externen 
Bussyst^men (0703) ubertragen. Das externe Bussystem fdhrt 
beispielsweise zu IO-FIFOs und/oder Protokollkonvertern. , 

Figur 7a zeigt eine Schaltung zum Schreiben von Daten, die 
15 von 0104 .eingehenden Adressen und Daten werden miteinander 
verkntipft (0701). In der Interfaceschaltung . (0701) kann eine 
FIFO-Stufe zur Entkopplung zwischen 0104 und 0703 vorgesehen 
sein. 

20 Figur 7b zeigt eine Schaltung zum Lesen von Daten, bei wel- 
cher eine Quittierungschaltung (0702, z.B. FIFO, Zahler) fur 
die .Abstimmuhg der ausgehenden Adressen mit den eingehenden 
Daten vorgesehen ist-'. In 0701a und/oder in 0701b kann eine 
FXFO-Stufe zur Entkopplung zwischen 0104 und 0703 vorgesehen 

25 sein. Sofern in 0701b eine FIFO-Stufe vorgesehen ist, kann 
diese auch fur die Quittierungschaltung 0702 mitverwendet 
werden. 

Figur 8 zeigt eine mogliche Verbindungsstruktur zwischen In- 
30 terface-Baugruppen und/oder PAEs mit dediziertem globalen Bus 
(0801) und Protokollkonvertern (0802) zu externen (Haupt- 
).Speichern und/oder sdnstigen (peripheren) Datenstromeri. Die 
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Interface-Baugruppen sind mit einem PA, vorzugsweise tiber de- 
ren Netzwerk entsprechend 0104 verbunden (0803) . 
Zwischen Interfdce-Baugruppen und/oder PAEs mit dediziertem 
globalen Bus (0801) und Protokollkonvertern (0802) ist ein 
5 Bussystem (0804a, 0804b) vorgesehen. 0804 kann in einer be- 
vorzugten Ausgestaltung Daten tiber mehrere Registerstufen ge- 
pipelinet ubertragen. 0804a und 0804b werden uber Schalter 
(z.B. 0805), die beispielsweise als Transmission Gates 
und/oder Tristate-Buf f er und/oder Multiplexer ausgestaltet 

10 sihd, miteinander verschaltet. Die Multiplexer werden zeilen- 
/spaltenweise angesteuert. Ansteuereinheiten (0806) steuern 
den Datentransf er der Interface-Baugruppen. und/oder PAEs mit 
dediziertem globalen Bus (0801) an die Protokollkonverter 
(0802), also die Transf errichtung 0804a and 0804b. Ansteuer- 

15 einheiten (0807) steuern den Datentransf er der Protokollkon- 
verter (0802) auf die Interf ace-Baugruppen und/oder PAEs mit 
dediziertem globalen Bus (0801), also die Transferrichtung 
0804b an 0804a. Die Ansteuereinheiten (0806) dekodieren je- 
weils Adressbereiche zur Selektion der Protokollkonvertern 

20 (0802), die Ansteuereinheiten (0807) dekodieren jeweils IOIDs 
zur Selektion der Interf ace-Baugruppen und/oder PAEs mit de- 
. diziertem globalen Bus (0801). 

Ansteuereinheiten konnen nach unterschiedlichen Ansteuerarten 
arbeiten, z.B, Feste Verbindung ohne I}ekodierung; Dekodierung 

25 von Adres sen und/oder IOIDs r Dekodierung von Adressen 

und/oder IOIDs und Arbitrierung. Ein oder mehrere Daten- 
/Adressworte konnen pro. Arbitrierung ubertragen werden. Die 
Arbitrierung kann nach unterschiedlichen Regeln erfolgen. 
Die Interface-Baugruppen konnen bevorzugt einen kleinien FIFO 

30 fur Adressen. und/oder Daten in Ausgangs- und/oder Eingangs- 
richtung aufweisen. Eine besondere Arbitrierungsregel arbi- 
tiert bevorzugt eine Interface-Baugruppe mit beispielsweise 
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vollem (FULL) oder leerem (EMPTY) oder zu leerendem (FLUSH) 
. FIFO. 

Ansteuereinheiten kc3nnen beispielsweise nach DB 199 26 538.0 
Fig. 32 aufgebaut sein. Diese Ansteuereinheiten kGnnen ftir 

5 0807 oder 0806 verwendet werden. Bei Verwendung als 0806 en- 
spricht 0812 0804a und 0813 entspricht 0804b. Bei Verwendung 
als 0807 enspricht 0812 0804b und 0813 entspricht 0804a. 
Dekoder (0810) dekodieren die Adressen/IOIDs der eingehenden 
Busse (0812) und steuern einen Arbiter (0811) an/ der wieder- 

10 urn die eingehenden Busse iiber einen Multiplexer auf einen 
Ausgangsbus (0813) schaltet. 

Die Protokollkonverter sind an externe Bussysteme (0808) ge- 
koppelt, wobei mehrere Protokollkonverter auf demselben Bus- 
system (0809) aufgeschaltet sein konnen, wodurch sie diesel- 

15 ben externen Ressourcen nutzen konnen. 

In den Protokollkonvertern sind bevorzugt die IO-FIFOs inte- 
'griert, denen bei Bedarf ein FIFO (BURST-FIFO) fur die Steue- 
rung von Bursttransf ers fur die externen Busse (0808) nachge 
schaltet ' ist . In einer bevorzugten Ausgestaltung ist den FI- 

20 FOs eine weitere FIFO-Stufe (SYNC-FIFO) zur Synchronisation 
der ausgehenden Adressen mit den eingehenden Daten nachge- 
schaltet; 

Verschiedene jeweils programmierbare/konf igurierbare FIFO- 
'S truktur en sind in 0820-0823 dargestellt. A kennzeichnet die 

25 Laufrichtung eines Adress-FIPOs, D die Laufrichtung eines Da 
ten-FIFOs. Die DaitenObertragungsrichtung der FIFOs ist abhan 
gig von der DatenObertragungsrichtung und Betriebsart. 
' Arbeitet eine VPU* als Busmaster, werden bei einem Schreibzu- 
griff (0820) Daten und Adressen von intern auf den externen 

30 Bus ttbertrag^n', bei einem Lesezugriff (.0821) werden Adressen 
von intern nach extern und Daten vori extern nach intern iiber 
* tragen. 
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Arbeitet eine VPU als Busslave, werden bei_einem Schreibzu- 
griff (0822) Daten und Adressen von den externen Bus nach in- 
tern ubertragen, bei einem Lesezugriff (0823) werden Adressen 
von extern nach intern und Daten von intern nach extern ttber- 
5 tragen. . 

Bei s&ntlichen Datentransfers konnen Adressen und/oder Daten 
IOIDs und/oder APIDs zugeordnet und in den FIFO-Stufen mit 
gespeichert werden. 

In einer besonders bevorzugten Ausgestaltung kann durchdie 
10 Entkopplung der Datentransfers durch die jeweiligen FIFO- 
Stufen, der Transferrate (Arbeitsf requenz) der Bussysteme 
0104, 0804 und 0808/0809 jeweils unterschiedlich sein. Insbe- 
sondere k5nnen die externen Bussysteme (0808/0809) beispiels- 
weise mit einer * hoheren Transferrate arbeiten als die inter- 
15 nen Bussysteme (0104) und/oder (0804). 

Figur 9 zeigt einen moglichen Ablauf eines Datenlesetransf ers 
uber die Schaltung nach Figur 8, 

Adressen (vorzugsweise Kennungen wie z.B. mit IOIDs und/oder 
20 APIDs) werden iiber das interne Bussystem 0104 an Interface- 
Baugruppen und/oder PAEs mit dediziertem globalen Bus uber- 
tragen, die vorzugsweise einen internen FIFO (0901) aufwei- 
sen. Uber ein Bussystem (z.B. .0804) das bevorzugt gepiplinet 
(0902) arbeitet, werden die Adressen in einen IO-FIFO (0903) 
25 ubertragen. Ober einen weiteren Bus (0904), der gepipelinet 
aufgebaut. sein kann aber vorzugsweise kurz und lokal ist wer- 
den die Adressen in/einen BURST-FIFO (0905) ubertragen. Das 
BURST-FIFO dient der korrekten Abwicklung von Bursttransf ers 
iiber das externe Bussystems, beispielsweise 2ur Steuerung von 
30 Burst-Adressen und -sequenzen und der Wiederholung von Burst- 
zyklen bei aufgetretenen Fehlem. IOIDs und/oder APIDs von 
Adressen (.0906) die iiber das externe Bussystem ubertragen 
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werden, konnen mit den Adressen mittibertragen werden und/oder 
in einem zusStzlichen SYNC-FIFO (0907) gespeichert werden. 
Das SYNC-FIFO gleicht die Latenzzeit zwischen ausgehender 
Adresse (0906) und eingehenden Daten (0909) aus. Eingehenden 
5 Daten kGnnen IOIDs und/oder APIDs (0908) der sie referenzie- 
renden Adressen uber das SYNC-FIFO zugeordnet werden (0910) . 
Die Daten (und yorzugsweise IOIDs und/oder APIDs) werden in 
einem IO-FIFO (0911) gepuffert und werden danach uber ein 
Bussystem (z.B. 0804) das bevorzugt gepiplinet (0912) arbei- 
10 tet an eine Interface-Baugruppe und/oder PAE mit dediziertem 
globalen Bus (0913) tibertragen, die bevorzugt einen internen 
FIFO beinhaltet. Von dieser werden die Daten an das interne 
Bussystem (0104) weiteriibertragen. 

Optional konnen eingehende Daten angtatt in den IO-FIFO 
15 (0911) zunachst in einen nicht eingezeichneten zweiten BURST- 
FIFO geleitet werden, der sich entsprechend des BURST-FIFOs 
0905 verhalt, sofern ein Burst-Error-Recovery auch bei Lese- 
. zugriffen erforderlich ist. Danach werden die Daten an 0911 
weitergeleitet . 

20 

Figur 10. entspricht pr'inzipiell Figur 8, weshalb dieselben 
Referenzen verwendet wurden. Es wurden in dieser beispielhaf- 
ten Ausgestaltung weniger Interf ace-Baugriippen und/oder PAEs 
mit dediziertem globalen Bus (0801) und weniger Protokollkon- 

25 verter (0802) zu externen (Haupt-) Speichern und/oder sonsti- 
gen (peripheren) Datenstromen eingezeichnet. Zusatzlich wurde 
ein Collector (1001) eingezeichnet, der derart an die Bussy- 
steme 0804 angeschlossen ist, dass Daten von den Interface- 
Baugruppen und den Protokollkonvertern in. den Collector ge- 

<30 schrieben und/oder aus diesem gelesen werden konnen. Uber die 
Ansteuereinheit 1007, die 0807 entspricht wird der Collector 
auf die 0804a Bussysteme auf geschaltet, (iber die Ansteuerein- 
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heit 1006, die 0806 entspricht wird der Collector auf die 
0804b Bussysteme auf geschaltet. 

Mehrere Collectoren konnen implementiert sein, wozu mehrere 
Ansteuereinheiten 1006 und 1007 verwendet werden, 
5 Ein Collector kann in mehrere Speicherbereiche segmentiert 
sein. Jeder Speicherbereich fQr sich kann in unterschiedli- 
chen Speichermodi arbeiten, beispielsweise als Random Access 
Speicher, FIFO, Stack, Cache, MMU Page etc. 
Einem Collector kann eine Obersetzungstabelle (TLB) (1002) 
10 zugeordnet sein, um eine MMU-artigen Betriebsart zu ermSgli- 
chen. Die Seiten (Page) Verwaltung kann beispielsweise anhand 
von Segmentadressen und/oder. sonstigen Kennungen wie bei- 
spielsweise APIDs und/oder IOIDs arbeiten. 

Vorzugsweise ist einem Collector eine DMA oder mehrere DMAs 
15" zugeordnet, um Datentransf ers mit externen (Haupt-) Speichern 
und/oder sonstigen {peripheren) DatenstrSmen durchzufuhren, 
insbesondere um die MMU-Funktion der Pageverwaltung (laden, 
schreiben) von Pages automatisch zu ermoglichen. DMAs konnen 
zur .Adressubersetzung zwischen externen (Haupt-) Speichern 
20 und/oder sonstigen (peripheren) Datenstromen und Collector 
ebenfalls auf die TLB zugreifen. DMAs k5nnen'in einer mogli- 
chen Arbeitsweise Adressvorgaben aus dem Array (PA) erhalten, 
beispielsweise uber 0804. 

DMAs konnen durch eine oder mehrere der folgenden Einheiten 
25 angesteuert werden: Einer dem Collector zugeordneten MMU bei- 
spielsweise im Falle von Pagefaults; dem Array (PA); einem 
externen Bus (z.B. 0809); eihem externen Prozessor; einer 
iibergeordneteri Ladeeinheit (CT) . 

Collectoren k5nnen Zugiriff auf ein dediziertes und bevorzugt 
! 30 auch DMA-gesteuertes sowie. bevorzugt Master/Slave fahiges 

Businterface (1004) mit Protokollkonverter entsprechend oder 
ahnlich den Protokollkonverterh 0802 zu externen 
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(Haupt-)Speichern und/oder sonstigen {peripheren) Datenstro- 
men besitzen. 

Ein externer Prozessor kann direkten Zugriff auf Collectoren 
haben (1007). 

5 

Figur 11 entspricht prinzipiell Figur 9, weshalb dieselben 
Referenzen verwendet wurden. In den Datenstrom integriert ist 
ein Collector (1101) mit zugeordneter Transfersteuerung (z.B. 
DMA bevorzugt mit TLB) (1102). Das Array (PA) transferiert 

10 Daten nuniaehr bevorzugt mit dem Collector (1103) . Dieser 

tauscht die Daten bevorzugt weitgehend selbstandig (iber 1102 
gesteuert mit externen (Haupt-) Speichern und/oder sonstigen 
(peripheren) Datenstromen aus (1104) . Bevorzugt arbeitet' der 
Collector in einer segmentierten MMU-ahnlichen Arbeitsweise, 

i5 wobei unterschiedlichen Adressbereiche und/oder Kennungen wie 
APIDs und/oder IOIDs unterschiedliche Pages zugeordnet sind. 
Bevorzugt kann 1102 durch Pagefaults gesteuert werden. 

Figur 12 zeigt ein Ablaufschema von Datentransfers fur unter- 
20- schiedliche Applikationen. Ein Array (PA) verarbeitet Daten 
entsprechend dem in DE 196 54 846.2 beschiebenen Verfahren 
durch Speicherung von Operanden und Ergebnissen in den Spei- 
chern 1202 und 1203. Dem PA sind zusatzlich ein Dateneingabe- 
kanal (1204) und ein DatenausgabSkanak (1205) zugeordnet, 
25 durch die Operanden und/o.der Ergebnisse geladen bzw. gespei- 
chert werden. Die Kanale k5nnen zu externen (Haupt-) Speichern 
und/oder sonstigen (peripheren) Datenstromen* (1208) fuhren. 
Die Kanale konnen aus ihternen • FIFO-Stuf en und/oder PAE- 
RAMs/PAE-RAM- ?ages. und/oder Cpllectoren/Collectorpages beste- 
30 hen. Die Adressen (CORR-ADR) konnen aktuell durch eine in 

1201 ablaufende Konf iguration berechnet werden und/oder vor- 
berechnet sein und/oder durch DMA-Operationen eines (1003) 
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berechnet sein. Insbesondere kann eine Adressberechnung in- 
nerhalb 1201 (CURR-ADR) an einen Collector oder dessen DMA 
gefuhrt werden, um die Datentransfers des Collectors zu 
adressieren und zu steuern. Der Dateneingabekanal kann von 
5 einer vofhergehend auf 1201 ausgefahrten Konf iguration be- 
reits vorgeladen worden sein. 

• Die Kanale arbeiten bevorzugt in einer FIFO-ahnlichen be- 
triebsweise um Datentransfers mit 1208 durchzufiihren. 

10 In dem dargestellten Beispiel wird weiterhin ein Kanal (1207) 
wahrend der beschriebenen Datenverarbeitung innerhalb 1201, 
der von einer vorherigen Konf iguration oder Applikation ge- 
ftillt wurde, an 1208 geschrieben. Dieser Kanal kann ebenfalls 
aus internen FIFO-Stufen und/oder PAE-RAMs/PAE-RAM-Pages 

15 und/oder Collectoren/Collectorpages bestehen. Die Adressen 
k6nnen aktuell durch eine parallel in 1201 ablaufende Konfi- 
guration (OADR-CONF) berechnet werden und/oder vorberechnet 
sein und/oder durch DMA-Operationen eines (1003) berechnet 
sein. Insbesondere kann eine Adressberechnung innerhalb 1201 

20 (OADR-CONF) an einen Collector oder dessen DMA gefiihrt wer- 
den, um die Datentransfers des Collectors zu adressieren und 
zu steuern. 

Weiterhin werden gleichzeitig Daten fur eine nachfolgende 
25 Konfiguration. oder Applikation in einen weiteren Kanal gela- 
den (1206) . A'uch dieser Kanal kann aus internen FIFO-Stufen 
und/oder PAE-RAMs/PAE-RAM-Pages und/oder Collecto- 
ren/Collectorpages bestehen. Die Adressen konnen aktuell 

* durch eine parallel in 1201 ablaufende Konfiguration (IADR- 
30- CONF) berechnet werden und/oder vorberechnet sein und/oder 

durch DMA-Operationen eines (1003) berechnet sein. Insbeson- 
dere kann eine Adressberechnung innerhalb 1201 (IADR-CONF) an 
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einen Collector oder dessen DMA gefiihrt werden, um die Daten- 
transfers des Collectors zu adressieren und zu steuern. 
Einzelne Eintrage in den jeweiligen Kanalen konnen unter- 
schiedliche Kennungen, z.B. IOIDs und/oder APIDs aufweisen, 
5 um jeweils einer bestimrate Ressource und/oder Speicherstelle 
zugeordnet werden zu k5nnen. 

Figur 13a zeigt eine bevorzugte Implementierung eines BURST- 
FIFOs. 

10 Zuhachst soil die Funktion fiir einen Ausgabe-FIFO der seine 
Werte an einen burst-fahigen Bus (BBUS) tibertr^gt beschrieben 
werden. Ein erster Zeiger (1301) zeigt auf den aktuell an den 
BBUS auszugebenden Dateneintrag innerhalb eines Speichers 
(1304). Mit jedem ausgegebenen Datenwort (1302) wird der 1301 

15 um eine Position bewegt. Der Wert des Zeigers 1301 vor Beginn 
des aktuellen Bursttransf ers wurde in einem Register (1303) 
gespeichert. Tritt ein Fehler wahrend des Bursttransf ers auf, 
wird 1301 mit dem urspriinglichen Wert aus 1303 neu geladen 
und der Bursttransf er wird neu gestartet. 

20 Ein zweiter Zeiger (1305) zeigt auf die aktuelle Datenein- 
schreibposition im Speicher (1304) fiir einzuschreibende Daten 
(1306) . Um ein Oberschreiben eventuell bei einem Fehler noch 
ben5tigter Daten zu verhindern, wird der Zeiger 1305 mit dem 
Riegister 1303 yerglichen (1307), um einen Vollzustand des 

25 BURST-FIFOs anzuzeigen. Der Leerzustand des BURST-FIFOs kann 
durch Vergleich (1308) des Ausgabezeigers (1301.) mit dem Ein- 
schreibzeiger (1305) festgestellt werden. 
Arbeitet das BURST-FIFO far Einlesedaten von einem 
Bursttransf er, andern sich die Furiktionen wie folgt: 

30 1301 wird zum Einschreibezeiger fur die Daten 1306. Falls 

fehlerhafte Daten wahrend des Bursttransf ers ubertragen wur- 
den, wird die Position vor dem Bursttransfer in 1303 gespei- 
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chert. Tritt ein Fehler wahrend des Bursttransfers auf, wird 
1301 mit dem ursprunglichen Wert aus 1303 neu geladen und der 
Bursttransf er wird neu gestartet. 

Der Zeiger zeigt auf die Ausleseposition des BURST-FIFOs zum 
5 Auslesen der Daten (1302) . Urn ein vorzeitiges Auslesen von 
Daten eines noch nicht korrekt abgeschlossenen Bursttransfers 
zu verhindern, wird 1305 mit der in 1303 gesicherten Position 
verglichen (1307), um einen leeren BURST-FIFO anzuzeigen. Ein 
voller BURST-FIFO wird durch den Vergleich (1308) des Ein- 
10 schreibzeigers 1301 mit dem Auslesezeiger (1305) erkannt. 

Figur 13b zeigt eine mogliche Implementierung einer Burst- 
Schaltung, die mogliche Bursttransfers erkennt und Boundary- 
grenzen pruft. Die Implementierung ist einfach gehalten und 

15 erkennt lediglich lineare Adressf olgen. Datentransfers werden 
grundsatzlich als Bursttransf er gestartet. Bei der ersten 
nicht linearen Adresse wird der Bursttransf er abgebrochen. 
Durch eine Erweiterung einer Lobkahead Logik, die mehrere 
Adre.ssen im voraus pruft, lassen sich auch Bursttransfers ei- 

20 ner bestimmten Lange (beispielsweise 4) feststellen und in- 
itialisieren. 

Der Adresswert (1313) eines ersten Zugriffes wird in einem 
Register (1310) gespeichert. Der Adresswert eines darauffol- 
"genden Datentransfers wird mit dem, um, die Adressdif ferenz 

25 zwischen ersten Datentransfers und dem zweiten Datentransfers 
des Bursttransfers (typischerweise eine Wortbreite) erhohten 
Adresswert (1311) vpn 1310 verglichen (1312). Sind beide Wer- 
te gleich f so ist die Dif ferenz. der ersten Adresse und der. 
zweiten Adresse entsprechend der Adressdif ferenz des 

30 Bursttransfers zwischen zwei Burstadressen. Somit liegt ein 
korrekter Burst vor. Sind die Werte ungleich, mufi der 
Bursttransf er abgebrochen werden. 
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Die jeweils letzte gepriifte Adresse (1313) _ (die zweite Adres- 
se in der Beschreibung) wird jeweils in 1310 gespeichert und 
nachfolgend entsprechend mit der nachste Adresse (1313) ver- 
glichen. 

5 Zur Feststellung der Einhaltung von Burstgrenzen (Boundaries) 
wird das Adressbit (oder die Adressbits) , an denen die Boun- 
dary liegt des aktuellen Adresswertes (1313) mit dem Adress- 
wert des vorhergehenden Adresswertes (1310) verglichen (z.B. 
XOR 1314) . Sind die Adressbits ungleich wurde uber die Boun- 
10 dary gesprungen und die Steuerung des Bursts hat entsprechend 
zu reagieren (z.B. Abschlufi des Bursttransf ers und neues 
Starten) . 

Figur 14 zeigt beispielhaft yerschiedene Methoden, Speicher 
15 i.b. PAE-RAMs zu einem grofierem zusaramenhangenden Speicher- 
block zusammenzuschalten. 

Die Figuren 14a-14d verwenden soweit moglich dieselben Refe- 
renzen. 

Die Schreibdaten (1401) werden bevorzugt durch Pipeline- 
20 Stufen (1402) an die Speicher gefuhrt. Lesedaten (1403) wer- 
den bevorzugt ebenf all's Uber Pipelinestuf en (1404) von den 
Speichern abgefUhrt. Die Pipelinestuf e 1404 beinhaltet einen 
Multiplexer, der den jeweils aktiven Datenpfad weiterleitet . 
Der aktive Datenpfad kann beispielsweise durch das Anliegen 
25 eines RDY Handshakes erkannt werden. 

Eine Einheit (RangeCheck, 1405) zur Oberwachung der Adressen 
(1406) auf korrekte Werte innerhalb des Adressraumes kann op- 
tional vorgeisehen seiji'. 

In Figur 14a werden die Adressen uber Pipelinestuf en (1407a) 
30 an die Speicher (1408a) gefuhrt. Die Speicher vegleichen den 
hoherwertigen Adressteil mit einer fest vorgegebenen oder 
konf igurierb'aren (z.B. durch eine iibergeordnete Konfigurati- 
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onseinheit CT) Ref erenzadresse, die fur jeden Speicher ein- 
deutig ist. Bei Gleichheit wird der Speicher selektiert. Der 
niederwertige Adressteil dient der Auswahl der Speicherstelle 
im Speicher. 

5 In Figur 14b werden die Adressen liber Pipelinestuf en mit in- 
tegriertem Dekrementer (Subtraktion um 1) (1407b) an die 
Speicher (1408b) gefuhrt. Die Speicher vegleichen den hoher- 
wertigen Adressteil mit dem Wert null. Bei Gleichheit wird 
• der Speicher selektiert. Der niederwertige Adressteil dient 

10 der Auswahl der Speicherstelle im Speicher. 

In Figur 14c werden die Adressen iiber Pipelinestufen (1407c) 
an die Speicher (1408c) gefiihrt. Die Speicher vegleichen den 
hoherwertigen Adressteil mit Ref erenzadresse, die fur jeden 
Speicher eindeutig ist. Die Ref erenzadresse wird durch eine 

15 Addierer- oder Subtrahiererkette (1409), die ausgehend von 
einem Startwert (typischerweise 0) far jeden Speicher eine 
andere eindeutige Ref erenzadresse vorgibt. Bei Gleichheit 
wird der Speicher selektiert. Der niederwertige Adressteil 
dient der Auswahl der Speicherstelle im Speicher. 

20 In Figur 14d werden die Adressen iiber Pipelinestufen (1407d) 
an die Speicher (1408d) gefuhrt. Die Speicher vegleichen den 
hoherwertigen Adressteil mit Referenzadresse, die fiir jeden 
Speicher eindeutig ist. Die Referenzadresse wird durch eine 
in die Speicher integrierte Addierer- , s oder Subtrahiererkette 

25 (1410) ,. die ausgehend von einem Startwert (typischerweise 0) 
fur jeden Speicher eine andere eindeutige Referenzadresse 
vorgibt. Bei Gleichheit wird der Speicher selektiert. Der 
niederwertige Adressteil dient der Auswahl der Speicherstelle 
im Speicher. 

30 Fur 1402, 1404, 1407 kann beispielswiese FREGs der PAEs nach 
Figur 5 verwendet werden. Fur 1409 konnen je nach Laufrich- 
tung der Referenzadresse. FREG oder BREG verwendet werden. 
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Der beschriebene beispielhafte Aufbau hat insbesondere den 
Vorteil, dass samtliche Schreib-/Lesezugrif fe dieselbe La- 
tenzzeit aufweisen, da die Adressen und Daten tiber Register- 
5 stufen in den BREG/FREG gefuhrt werden. 

Figur 15 zeigt die Verwendung von GlobalTrack Bussystemen 
(1501, 1502, 1503, 1504) zur Kopplung von Konfigurationen die 
beliebige innerhalb einer Anordung von PAEs (1505) als Konfi- 

10 gurationsmakros (1506, 1507) (siehe auch DE 198 07 872.2, DE 
199 26 538.0, DE 100 28 397,7) konfiguriert wurden. Die Kbn- 
figurationsmakros weisen eigene interne Busverbindungen bei- 
spielsweise tiber interne Busse (0104) auf (1508). Die Konfi- 
gurationsmakros sind tiber 1503 miteinander zum Datenaustausch 

15 verbunden. Ober 1501, 1502 besitzt 1506 Anschlufl an Inter- 
face-Baugruppen und/oder lokale Speicher (PAE-RAMs) (1509, 
1510) . Ober 1504 besitzt 1507 Anschlufl an Interface- 
Baugruppen und/oder lokale Speicher (PAE-RAMs) (1511) . 

20 Beliebige weitere Ausgestaltungen und Kombinationen der er- 
lauterten Erfindungen sind moglich und einem Fachmann offen- 
sichtlich. 
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Patentansprttche 

1. Verfahren zum Entkoppeln von Datenstromen bei rekonf igu- 
rierbaren Bausteinen, dadurch gekennzeichnet, dafi einer 
Oder mehrere FIFO-Speicher die Baustein internen Daten- 
transfers von den externen Datentransfers entkoppeln, 

2. Verfahren zum Entkoppeln von Datenstrdroen bei rekonf igu- 
rierbaren Bausteinen, dadurch gekennzeichnet, daB mehrere 
unabhangige Adressgeneratoren vorgesehen sind. 

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet / daB die 
Adressgeneratoren unabhangig von der Datenverarbeitung 
konfiguriert werden. 

4. Verfahren zum Programmieren von rekonf igurierbaren Bau- 
steinen, dadurch gekennzeichnet, daB ein Compiler Adress- 
berechnungen in mehrere Konf igurationen zerlegt. 

5. Vorrichtung zur Datenverarbeitung mit einem Feld rekonf i- 
gurierbarer Bausteine und einer Schnittstellenanordnung 
zum Austausch von Daten, insbesondere Daten eines Daten- 
stromes zu verarbeitender Daten, znischen dem Feld rekon- 
figurierbarer Bausteine und einer externen Schaltungsan- 
ordnung, dadurch gekennzeichnet, daB die Schnittstellenan- 
ordnung zumindest einen FIFO-Speicher umfafit, in weichem 
Daten ablegbar sind und aus weichem Daten abgerufen werden 
kdnnen . 

6. Vorrichtung insbesondere nach dem vorhergehenden An- 
spruch, dadurch gekennzeichnet, daB eine Schaltungsanord- 
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nung vorgesehen ist, urn Daten zu bestimmen, welche in ei- 
ner zuktinf tigen Konfiguration benGtigt werden und diese 
Daten in die Schnittstellenanordnung bzw. einen Qber die^se 
schnell ansprechbaren Speicherbereich vorzuladen. 

7. Vorrichtung insbesondere nach dem vorhergehenden An- 
spruch, dadurch gekennzeichnet, dafl der schnellansprechba- 
re Speicherbereich ein Cache-Speicher, ein externer RAM 
und/oder FIFO-Speicher bzw. ein Register ist. 

8. Vorrichtung insbesondere nach einem der vorhergehenden 
Vorrichtungsanspriiche/ dadurch gekennzeichnet/ da£ ein 
Mittel zum Sichern von in einem Schnittstellenspeicher- 
mittel abgelegten Daten einer zuvor ausgefuhrten und zum 
Zeitpunkt des Datenabrufes zumindest partiell nicht mehr 
aktiven, gegebenenf alls durch Umkonf iguration beteiligter 
Feldelemente schon aufgehobenen Konfiguration und/oder 
zur Verhinderung des Loschens und/oder Uberschreibens be- 
reits einmal gesendeter, aber noch nicht als -beans tan - 
dungsfrei empfangener bekannter Daten vorgesehen ist. 

9. Vorrichtung insbesondere nach einem der vorhergehenden 
Vorrichtungsanspriiche , worin ein von mehreren Feldelemen- 
ten und/oder zu Konf igurationen gruppierten Feldelementen 
ansprechbarer Speicher fur wahlweisen Zugriff , insbeson- 
dere RAM-Zellen und/oder andere Speicherbanke vorgesehen 
sind, iim Daten nichtlokal zu speichern und/oder zwischen- 
zuspeichern. 
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